目录
0.好用的小工具(在线生成各种图形)
1.学习目标
- 区间型数据:了解区间型数据的特点,熟练使用「条形进度图、仪表盘、环形进度图」表示数据的进度和定量指标的定性化;
- 关系型数据:了解数据之间常见的关系类型,能熟练地根据数据之间的关系类型进行图表选型,掌握不同图表的特点、可视化原理和制作方法;
- 地理信息数据:了解地理信息数据的特点,掌握地理数据常用的可视化方案选型;
实践:根据给定的数据集,进行数据可视化,或者自选数据集也可以;
2.数据集
3.区间型数据可视化
区间数据一般分为两种情况:
- 第一类商户局:数据是比例型数据,本身就能从数据中直接用用;
- 数据是数值型数据,根据业务需要,可以对数据进行区间段划分.
3.1 条形进度图
条形进度图相对来说比较常用,可考虑子弹图和温度计图.
要注意的是,不同地区的文化中,不同颜色有不同寓意,要因地制宜.
3.2 仪表盘
仪表盘由表盘刻度,指针,指针所在角度三者构成,可直观展示某项指标的进度.
仪表盘三要素:
- 表盘刻度:用于度量数值的大小,且一般表盘的刻度范围是某项指标可能取值的区间.
- 指针:指针代表某一指标或者指标的某一维度,例如钟表的分针和秒针.
- 指针所在角度:指针角度,确定指针当前所指向的具体数值.
注意,建议指针数量不超过3根.
参考链接:Excel制作仪表盘
3.3 环形进度图
和仪表盘相比,环形进度图没有指针;和条形进度图相比,环形进度图的内部可以展示和定性指标关联的结果。
环形进度图展示的数据指标,其区间划分既可以和颜色映射,也可以和定性文字表达映射,具体方法参照条形进度图部分的表格示例。
环形进度条可通过环进行制作. 不需要的填充即可.
4.关系型数据可视化
数据之间的关系有以下几种:
- 数据间的包含关系->韦恩图
- 数据间的层级关系->漏斗图&矩形树图
- 数据间的分流关系->桑基图
- 数据间的联结关系->节点关系图
4.1 韦恩图
韦恩图通过面积的大小来映射集合元素的个数,重叠部分的面积,则代表多个数据集重合元素的个数。
在工作中,我们要研究多个数据集之间的包含关系,就可以使用韦恩图来展示数据。比如,购买啤酒的用户和购买尿布的用户有多少是重合的,收过某快递公司包裹的用户和选择某快递公司寄件的用户,有多少是重合的。
韦恩图的使用并不仅仅局限于人群的包含关系展示,只要你需要研究多个数据集的包含关系,都可以使用韦恩图,但是前提是:多个数据集描述的对象维度需要相同,比如都是用户ID或商品名称等。
韦恩图制作
4.2 漏斗图
漏斗图,适合作为具有层级关系的数据的可视化方式,特别是流程类或具有先后关系步骤的数据,且一般是用来描述单变量在不同环节的变化情况。
在网站或APP分析中,通常使用漏斗图来比较完整流程中,各关键步骤的转化率,以此来发现各个环节的问题并进行改进。在电商类购物网站中,常用漏斗图来分析用户从浏览商品至最终交易成功的各个关键环节的转化率,具体如下图所示:
放一个漏斗图
通过纵向对比各个环节的用户转化率和流失情况,可以发现业务流程中各环节存在的问题,从而采取相应的措施来改进。除了纵向对比以外,在实际业务中,也经常会横向对比不同时间周期的转化率情况,从而来评估某项改进措施的效果或发现现阶段的问题。
漏斗图制作
Excel制作漏斗图
4.3 矩形树图
矩形树图适合具有「树状结构」的层级关系数据的可视化,它通过「面积」来映射数据大小或者数据占比,通过颜色来区分类别。
且当矩形树图有多级结构时,通常需要一些交互来辅助数据细节的展示,如鼠标悬停显示实际数或占比、单击某个类别区域进入该类别细分视图、单击面包屑返回指定层级等。
(tableau容易生成)
4.4 桑基图
桑基图,是一种描述数据分流关系的可视化图表方案,它的优势是可以直观的展现数据流动。
它主要由边、流量和支点组成,其中边代表了流动的数据,流量代表了流动数据的具体数值,节点代表了不同分类。边的宽度与流量成比例地显示,边越宽,数值越大。
桑基图有一个重要特点就是保持能量守恒,即:所有主分支的高度总和=所有分出去的分支高度之和,因此桑基图也称为「桑基能量平衡图」。
起初,桑基图主要用于分析能源的用途流向和行业损耗、工业生产材料的成分构成、金融领域的资金流向等。后来,桑基图使用领域扩大,比如可以用于分析用户在网站或APP上行为路径和分流情况,比如分析家庭收入来源和支出流向,世界人口迁移等。
如果需要展示数据的分流情况,桑基图是一种绝佳的可视化方案。
(tableau容易生成)
4.5 节点关系图
节点关系图,常用来表示两个或多个对象之间的关系。
- 节点:表示一个对象,常用圆形、方形等形状来表示,有时还会在节点内显示对象图片等信息;
- 联系:如果两个节点之间有联系,则使用线段连接,线段上通常会有关系说明;
方向:节点之间联系的方向性,使用线段的箭头来表示联系的单向或双向;
比较常用的场景有,剧集中人物关系的可视化、个人的社交网络拓扑等。(知识图谱可用)5. 地理性数据可视化
地理型数据,是指数据的维度属性中包含地理信息,如国家、省份、城市、区、街道等。对于地理型数据的可视化,我们首先想到的可视化方案是使用地图。
一般用于体现的是地图和其他图形相互组合.
5.1 地图+散点图/气泡图/热力图
- 地图+散点图:数据的地理属性确定散点位置,数据大小则通过散点的颜色来体现,通常会配以色带来映射颜色的取值范围和大小关系。
- 地图+气泡图:数据的地理属性确定气泡位置,数据大小则通过气泡的面积来体现。
- 地图+热力图:数据的地理属性确定热力色块位置和面积,但是不代表其他含义,数据大小则通过热力图颜色的深浅来体现,通常会配以色带来映射颜色的取值范围和大小关系。
三者的共同点是,数据中的地理属性都会映射到地图上的具体位置;
不同点是,散点地图是通过散点的颜色来映射数值的大小,气泡地图是通过气泡面积来映射数值大小,热力地图是通过区域颜色的深浅来映射数值大小。
5.2 地图+线图
地图和线图结合的场景,一般是用于数据中具有两个维度的地理信息,用于展示数据的流入&流出情况,其数据格式一般为:「地理信息1+地理信息2+数值」。
其经常使用的场景包括:世界范围或者全国范围内的人口迁移,不同地区飞机/船舶/高铁等交通航线的繁忙程度和流向情况,不同地区包裹的寄出量或收货量等。
5.3 地图+饼图
当既要显示不同地理区域某一指标的数据总量,同时又要显示各地区某一指标总量的各构成部分占比时,可以使用「地图+饼图」结合的方式来进行可视化。
和普通的堆叠柱状图相比,「地图+饼图」可以显示更多的数据项,同时更加直观的展示数据和地理位置的关联性。但是要注意一个点,地图上的饼图的扇区个数,最好保持在2~4个左右,如果总体分类过多,饼图在地图上就会显得比较杂乱,可以考虑适度重新分组,以保证可视化呈现的最终效果。
6.习题
6.1 场景1:比较公司4个部门在2019年的年度销售额完成率
问题1:老板现在想要比较这4个部门,在2019年的年度销售额完成率,请问用什么图形表示?
本题采用仪表盘和温度计图进行展示.
6.2 场景2:某公司组织架构下的人员数量
问题2:现需要在一个图表中,展示公司的人员构成分布情况,请问用什么图表展示,说出分析思路,并进行可视化。
本题采用矩形树图进行展示.
7.参考文章
来源:https://www.cnblogs.com/smithpath/p/12011057.html