数据特征—帕累托分析
帕累托分析(贡献度分析) → 帕累托法则:20/80定律 “原因和结果、投入和产出、努力和报酬之间本来存在着无法解释的不平衡。一般来说,投入和 努力可以分为两种不同的类型: 多数,它们只能造成少许的影响;少数,它们造成主要的、重大的影响。” → 一个公司,80%利润来自于20%的畅销产品,而其他80%的产品只产生了20%的利润 例如: ** 世界上大约80%的资源是由世界上15%的人口所耗尽的 ** 世界财富的80%为25%的人所拥有;在一个国家的医疗体系中 ** 20%的人口与20%的疾病,会消耗80%的医疗资源。 一个思路:通过二八原则,去寻找关键的那20%决定性因素! import numpy as npimport pandas as pdimport matplotlib.pyplot as plt% matplotlib inline# 帕累托分布分析data = pd.Series(np.random.randn(10)*1200+3000, index = list('ABCDEFGHIJ'))print(data)print('------')# 创建数据,10个品类产品的销售额data.sort_values(ascending=False, inplace= True)# 由大到小排列,值的替换 plt.figure(figsize = (10,4)