做数据可视化分析时,会出现两个极端,一是不管什么需求,用表格干就完了。再者就是追求炫酷的可视化效果,堆叠各种“高端”的可视化图表,用户看不懂,华而不实。基于实际的分析需求以及要表达的信息内容,选择最匹配的图表形式,才能可视化得恰到好处。每种图表能够承载的数据格式以及反映的数据信息各不相同,这一次主要想分享瀑布图的用法,不管以后是做定制化的可视化页面开发,还是做自助BI图表类型的扩展,都会有所帮助。
一、瀑布图的使用场景
瀑布图适用于表达数个特定数值之间的数量变化关系,或者用来直观地呈现出现出影响总体值的关键维度,在企业经营分析、财务分析领域中应用广泛。Office2016之前版本的excel在绘制瀑布图时,是在柱形图的基础上进行加工得到的,所以瀑布图看起来有点像隐藏了部分柱身的柱图,但两者在信息呈现方式上还是有较大差异的。瀑布图中数据的排列形状(称为浮动列)看似瀑布悬空,从而反映数据在不同时期或不同因素对总体值影响的程度,还可以直观反映出数据的增减变化。财务分析企业利润构成、预算变更,以及产品库存或销售情况等场景下,经常会用到。
二、瀑布图的分类
瀑布图按照信息呈现的形态,可以分为结构瀑布图、变化瀑布图、堆叠瀑布图等不同的图表类型。
1.结构瀑布图
最常用来展示总分结构或序列变化,通过柱图垂直高度展示数据,直观地展示指标的构成,相比较饼图或常归的柱形图,可以将总体值与细分维度值同时展示出来,并且可以快速的反映出影响总体值的关键因子。主要用来反映目标指标的构成关系,例如每月支出费用构成项目细分,公司成本分摊等。现在基本上很少用现金付钱了,都是移动支付,对钱的概念就非常淡化了,加上信用卡的提前预付,到月底发现工资所剩无几。可以利用瀑布图来分析每月支出费用的去向,下图中,可以清晰的看出,总支出费用,以及在各项支出类型中,餐饮和子女教育占大头。
2.变化瀑布图
变化瀑布图可以清晰地反映某项数据经过一系列增减变化后,最终成为另一项数据的过程。例如,从营业额扣除各种费用、成本、税费等变成纯利润的过程,又如某个项目经费扣减各方面支出得出余额的过程,或者从年初预算,经过半年度、到年底的预算消耗使用情况,使用瀑布图均可以直观呈现数据变化的细节,方便及时调整和管控成本。最基础的是起点加终点的2阶瀑布图,对于周期比较长的项目,可以在中间的里程碑,再细分成更多阶的瀑布图,例如年初、年中及年末。
举个栗子,公司的发薪日是上班族最期待的时候了,虽然说多数时候发多少钱也不太会有太多惊喜或意外,但还是会想去看看钱到底是怎么发的。实发工资等于基本工资+各种绩效奖金-五险一金-各种扣款。按照基本工资、应发工资、实发工资三个阶段,看哪些是主要增项,哪些是重点减项,一目了然。
3.堆叠瀑布图
变化瀑布图的基础上增加子项在细分维度上的分布及变化趋势。例如,年初预算1000万,年中600万,年末剩余200W,第一个层级是1-12月各个月份的预算使用,同时,需要查看每个月份,各个成本项目(人力、服务器、采购等)的构成情况,此时就可以使用堆叠瀑布图来呈现。
三、瀑布图的数据格式要求
1.利用Excel绘制瀑布图
Excel2016及以上的版本自带瀑布图的功能,不管是结构瀑布图还是变化瀑布图都可以非常快速的配置出来。
第一步按照瀑布图的数据格式要求,将数据整理准备好,插入瀑布图后,即可得到一个基础的图表。
其次是,对瀑布图进行优化调整,例如设定汇总后,增加或减少时的系列颜色。在需要汇总的柱子上单击两次,即可调出瀑布图配置参数。
2.自助式BI分析设计时的参数要求
自助BI产品是让业务人员基于数据集,灵活的选择维度、度量字段,进行可视化分析。结构瀑布图支持1个维度、1个指标,或者0个维度多个指标,相比较Excel个性化的数据处理的方便性,数据集模型的数据则是通用的字段结构,例如选择了某一个维度,SQL拼接的逻辑是按照该字段进行Groupby操作,因此需要在可视化展示时,还需做汇总行的计算处理,另外,需要对维度枚举值的数量、图表展示样式等参数进行设置。
变化瀑布图支持1个维度、1个指标,或者0个维度多个指标,除了基础的维度度量过滤条件选择外,还需要选择按照哪一个子维度进行细分,例如,以年度作为汇总值,再按照地区进行细分,查看两个年度之间,各个地区的变化情况。
图片来源:火山引擎官方帮助文档
四、瀑布图制作的其他建议
由于瀑布图会同时包括汇总值和各个子维度的变化值,经常会出现汇总值量级过大,但子维度量级非常小的情况,会出现量级小的维度值区分度过低的问题,所以在图表处理时,可以采用截断的方式。示例如下:
五、总结