使用树状图做层次聚类分析
一、实验目的 如果您以前从未使用过树状图,那么使用树状图是查看多维数据如何聚集在一起的好方法。 在这本笔记本中,我将简单探索通过层次分析,借助树状图将其可视化。 二、层次分析 层次分析是聚类分析的一种,scipy有这方面的封装包。 linkage函数从字面意思是链接,层次分析就是不断链接的过程,最终从n条数据,经过不断链接,最终聚合成一类,算法就此停止。 dendrogram是用来绘制树形图的函数。 三、实验数据 grain_variety是标签,其他列为多种属性的值(特征)。 from scipy.cluster.hierarchy import linkage, dendrogram import matplotlib.pyplot as plt import pandas as pd seeds_df = pd.read_csv('seeds-less-rows.csv') seeds_df.head() #移除grain_variety varieties = list(seeds_df.pop('grain_variety')) varieties ['Kama wheat', 'Kama wheat', 'Kama wheat', 'Rosa wheat', 'Rosa wheat', 'Rosa wheat', 'Rosa wheat', 'Rosa wheat',