数据可视化 | seaborn绘制散点图

大兔子大兔子 提交于 2021-02-14 13:53:54


  • Python-seaborn 绘制多类别散点图
  • seaborn 定制化美化设置

Python-seaborn 绘制多类别散点图

由于涉及的图表类型为多类别散点图的绘制,在使用常规matplotlib进行绘制时会显得格外繁琐,所以我们选择了对matplotlib进行了更高级的API封装,使作图更加容易的seaborn包进行图表的绘制,更多seaborn 介绍,大家可以直接去seaborn官网进行相关资料的查阅。数据的读取使用的功能强大的数据处理包 pandas ,这里只是进行简单的删除空值操作,直接使用dropna() 函数操作即可,我们直接预览数据,如下(部分):由于我们直接使用了seaborn进行图表的绘制,绘图代码也得到了极大的简化,默认的绘图代码如下:

fig, ax = plt.subplots(figsize=(6,5),dpi=200)
scatter = sns.scatterplot(data=penguins_df,x="bill_length_mm",y="bill_depth_mm",hue="species",
                          size="body_mass_g",ec="k",alpha=.9,ax=ax)
scatter.legend()
ax.text(.91,-.1,'\nVisualization by DataCharm',transform = ax.transAxes,
        ha='center', va='center',fontsize = 7,color='black')

可视化效果如下:

这配色、这布局······,这个图表中主要存在如下问题:

  1. 刻度、轴脊、XY刻度标签等属性过于简陋。
  2. 图例添加太随意,需要定制化操作(重点)
  3. 整体的绘图主题过于简单。

针对以上几个问题,接下来我们对其进行美化操作。

seaborn 定制化美化操作

详细的美化操作对于seaborn来说,代码过多,且需记住的绘图函数也较多,直接选择matplotlib 绘图主题进行设置即可,此外,我们还对图例等图元素进行设置,具体代码如下:

plt.rcParams["font.family"] = "Arial-Narrow"
palette = ("#FF8C00""#A034F0""#159090")
plt.style.use('fivethirtyeight')
fig, ax = plt.subplots(figsize=(6,5),dpi=200)
scatter = sns.scatterplot(data=penguins_df,x="bill_length_mm",y="bill_depth_mm",hue="species",size="body_mass_g",
                    palette=palette,ec="white",alpha=.9,ax=ax)

#自定义图例设置
handles,labels = scatter.get_legend_handles_labels()
labels_size =  labels[5:]
labels_size = [str(int(i)/1000)+" kg" for i in labels_size]

scatter.legend(handles=handles[1:4] + handles[5:], labels=labels[1:4] + labels_size ,ncol=1,loc="lower right",
               frameon=False,fontsize=7,markerscale=1,bbox_to_anchor=(1, 0.0))

scatter.set_xlabel("Bill length (mm)")
scatter.set_ylabel("Bill depth (mm)")

#添加标题
ax.text(-.08,1.1,"Base Charts in Python Exercise 01: Point Charts",
       transform = ax.transAxes,color='k',ha='left',va='center',size=15,fontweight='extra bold')

ax.text(.91,-.1,'\nVisualization by DataCharm',transform = ax.transAxes,
        ha='center', va='center',fontsize = 7,color='black')

plt.show()

这里注意以下几点:

  1. 绘图主题的选择
plt.style.use('fivethirtyeight')

这样就选择了对应的绘图主题。

  1. 自定义图例设置
handles,labels = scatter.get_legend_handles_labels()
labels_size =  labels[5:]
labels_size = [str(int(i)/1000)+" kg" for i in labels_size]

scatter.legend(handles=handles[1:4] + handles[5:], labels=labels[1:4] + labels_size ,ncol=1,loc="lower right",
               frameon=False,fontsize=7,markerscale=1,bbox_to_anchor=(1, 0.0))

该部分代码就实现了图例的定制化操作,具体包括:图例元素选择、位置以及排列方式等.

这里指出一下:由于seaborn是对matplotlib的高度封装,这也导致其对个别图表元素的定制化设置就相对较难(如图例)

最终的可视化效果如下:

当然我们还可以将图例放置在上方并排显示,对应修改代码如下:

scatter.legend(handles=handles[1:4] + handles[5:], labels=labels[1:4] + labels_size ,ncol=8,loc="upper center",
               frameon=False,fontsize=7,markerscale=1,bbox_to_anchor=(0.5, 1.03))

可视化效果如下:

总结

本期推文我们推出了基础散点图的Python绘制版本,希望可以满足喜欢使用Python绘图的小伙伴。大家有啥意见也可以在文末 读者讨论 区进行谈论交流啊。


数据处理·机器学习·可视化

行业资讯·学习资料

长按关注不迷路


本文分享自微信公众号 - 好奇心Log(Curiosity-log)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!