当前位置 > 首页 > 技术热点 > 阿里巴巴大牛是怎么写数据分析报告的?

阿里巴巴大牛是怎么写数据分析报告的?

来源:中国数据分析行业网 | 时间:2020-09-27 | 作者:数据委

在当今企业纷纷推动数字化运营的背景下,“No Data, No BB”成了职场人的口头禅。做一份好的数据分析报告,大到成为能否帮助企业做出正确的商业决策,小到成为能否说服老板获取业务资源的关键因素。
今天数据君和大家一起来学习一位阿里巴巴大牛数据分析师撰写分析报告的经验之谈:

01  表达主题决定了我们的图表形式

决定分析报告图表形式的并不是拥有的数据是什么,而是你所需要表达的主题是什么。
图1和图2是根据一份相同的数据,展现的2个不同的图表:

 

上图可以发现对于相同的数据,因为我们所需表达的主题的差异,也将呈现完全不同的展现方式。图1表达的主题是爽肤水和沐浴露两个品类在不同城市的销量排名,图2主要表达的主题是在相同城市在两个不同的品类的销量差异。
因此在下笔做分析报告之前,先仔细想好自己要表达的主题是什么。

02  不要放弃“标题”这个绝佳位置

有些图表的标题就和猜谜一样例如:公司销售趋势、分公司销售分布情况。完全没有指出图表的重点,公司销售趋势是怎么样的?分公司销售分布又是如何?
我们需要强调的重点应该放在图表最前面减少听众误解的可能性,并让他们的注意力集中到我们所想强调的数据上。
如下图,这张图到底是为了表达全量销售金额没有明显的增长呢?还是为了表达2月份销售金额断崖式下跌?还是为了表达其它什么主题呢?请在标题上明确的告诉听众。

 

03  处理“成分对比”关系

成分对比主要体现在一个整体的每个部分的百分比的对比常常出现“份额”、“百分比”等词汇,并使用饼图来展现。

 

饼图在使用中建议不超过6个部分,如果超过6个部分,可以把剩余部分归类到“其它”项中。另外由于人们看数据习惯顺时针看数据,因此可把最重要部分放到12点位置,并用对比度强烈的颜色突出显示。
饼图主要在标识单一整体各部分比例,如果需要比较两个整体的成分时,重点考虑柱状图(图3)。因为如果使用饼图(图4)会导致读者视线需要在不同图表间来回移动。

 

 

 

04  处理“项目间对比”关系

项目间对比主要是比较不同项目间的情况,常常出现“排名”、“大小”等词汇。项目间对比通常使用条形图来展示。

 

我们对于条形图的顺序需要深思熟虑,如果天然是有序的则按天然的顺序,例如人生阶段婴儿、少年、青年、中年、老年。但是如果没有这种天然顺序,需要考虑什么顺序对于我们数据主题是最有意义的,并根据我们所需要突出的主题,选择条形图的排序方式。

05  处理“时间序列对比”关系

时间序列对比关心的是随时间变化的对比常常出现“变化”、“增长”、“下降”等词汇。时间序列对比通常使用柱状图或折线图来展示,如果时间点不多时可以使用柱状图,如果时间点是很长一段时间范围使用折线图更为合适。

对于折线图,趋势线一定要比背景线粗。当存在同一张折线图存在多条折线时,需要将最关注的线加粗加亮。但是当出现非常多折线时,我们的折线图就会呈现出“方便面式”图表,往往导致图表混乱。如下图:

 

 

 

06  处理“频率分布对比”关系

 

频率分布对比表现的是数据分布范围情况,常常出现“范围”、“密度”、“分布”等词汇。频率分布对比通常使用柱状图或折线图来展示,当比较范围数量较多时可使用折线图,较少时可通过柱状图。

 

频率分布的范围大小非常重要,既不能太大也不能太小,建议5到20个分组。不同分组的大小应相同,否则会造成数据扭曲。

07  处理“相关性对比”关系

 

相关性对比表现的是不同变量之间的关系,常常出现“与XX有关”、“随XX增长”等词汇,通常使用散点图或双条形图来展示。
在双条形图中,我们将独立变量按顺序排在左边,而把对比值放在右边,如果期望模式与实际模式一致时,右边的条形图就会变成左边的条形图的镜像,如下面左图。当关系不符合预期时,两组条形图则会发生偏离,如下面右图:
 

08  处理“多重对比”关系

对比可能不仅仅是一种对比关系,有可能是结合上文所说的成分、项目间、时间序列、频率分布、相关性对比中的一种或多种组合而成,我们称之为“多重对比”。例如“销售额在过去10年内稳步增长,但利润却没有同步增长”,这案例第一部分“销售额在过去10年内稳步增长”属于“时间序列对比”,第二部分“但利润却没有同步增长”属于项目间对比。对于这种情况,我们需要确定哪一种关系是主要的,哪一种是次要的。案例中,第一部分随时间变化是主要的,而销售额与利润项目间对比是次要的,因此最好选择以时间变化对比的折线图,并为每一个项目画一条支线的方式实现,如下图:
 

09  不仅仅只有图表

当然,对于数据分析报告,可定量信息我们可以通过图表构建,但是对于不可定量的信息,我们可以通过一些几何图形形成概念性视觉图像,或通过一些日常事务作视觉比喻。
例如说到目标,可以形成高山这样的视觉图像。这需要发挥自己的想象力,平时多留意写优秀的海报广告,在生活中寻找灵感,在报告中能够做到与听众产生共鸣的效果。

10  消除认知负荷

听众在接受我们分析报告信息时,需要消耗脑力去学习新知识,脑力是有限的,因此需要消除听众无关紧要的脑力消耗。造成无关紧要脑力消耗最大的问题就是“杂乱”,因此消除杂乱是数据分析报告需要重点关注的。
通过将文字从原来居中对齐调为左对齐,进行相关的无关数据的淡化的处理,能减少听众的认知负荷,把关注点转移到我们的重点上。
通过消除一些干扰,能突出我们所需要表达的重点。同时要突出我们需要吸引听众实现的地方。在文字中可通过加粗、颜色、斜体、大小、空间隔离、下划线等手段突出文字关键词。在图表中主要通过颜色、大小突出需要强调的内容。在使用颜色时需慎重选择,不能在一张图中有太多颜色,造成视觉干扰;可以使用颜色的不同饱和度来强调数据;根据分析报告背景,可选择对于的互补色来做内容的突出强调。

11  讲好分析报告

 

分析报告做好了,还需要以更好的语言表达方式呈现给听众。

可以把分析报告当做一个故事来说,能更加引人入胜。首先对整个背景做设定,接着介绍什么因素上下文驱动情节的演进,举例说明发生了什么样的冲突,基于这些冲突有哪些假设,再基于这些假设如何做数据验证,最后通过什么方式带来什么解决方案。
为了保证整个分析报告的逻辑清晰,可以构建类似金字塔的逻辑结构,以某一个中心论点为塔尖,在其以下分支出不同论点的数据分析支撑,让听众对我们的分析报告有个清晰的逻辑结构。