麦当劳店铺数据分析

狂风中的少年 提交于 2020-10-02 11:10:22

数据集文档

数据说明

数据从Kesci下载而来:数据集通过爬虫获取得来,获取说明参考原文:https://mp.weixin.qq.com/s/j23JPO2Y3kmhK8TsSJtbQg

问题描述

1、麦当劳店铺数的多少是否与城市等级有关
2、麦当劳店铺数的多少是否与城市人口有关
3、麦当劳店铺数的多少是否与城市的 GDP 有关

从以上三个角度进行数据分析,制作的内容如下:
可视化:
x 轴- y 轴
店铺数-城市(横柱状图)
城市等级占比(饼状图)
人口-店铺数(散点图 + 回归直线)
城市名-店铺数 + GDP(并列柱状图)

一、数据处理

(1)导入数据

(2)判断是否有空值

通过isnull()方法我们可以看出,这三个文件都没有空值,也就是数据比较完整。因此我们可以进行下一步的可视化分析了。

二、数据可视化分析

1、店铺数-城市(横柱状图)

此结果图列举了麦当劳在中国城市所有店铺数在各个城市的数量有多少,从图中我们可以看出,“北上广深”四个城市的麦当劳店铺数都在 100 以上,稳居前四,并且他们都是一线大城市,那麦当劳店铺数会不会与城市等级有关呢? 针对问题一,我们做出如下可视化分析:

(2)城市等级占比(饼状图)

结论:从上图看出,全国城市等级所对应的麦当劳占比,一线,二线,三线,四线,五线,依次递减,一线城市拥有的麦当劳数时最多的,从而验证了我们的想法,城市等级越高,麦当劳数也相应的多一些 。

(3)人口-店铺数(散点图 + 回归直线)

结论:由上面的回归模型可以看出人口数量与麦当劳店铺数关联不是很大,人口数量在0-500万左右时,麦当劳店铺基本不超过50家。

(4)城市名-店铺数 + GDP(并列柱状图)

结果图中虽然店铺数不够的柱状图不够明显,但是从数字上以及上面的店铺数-城市(横柱状图)”可以看出店铺数与GDP值的趋势基本一致,也就是说GDP也是一个影响一个城市麦当劳店铺数的因素。下面我们对GDP与麦当劳店铺数做一个回归模型,来验证我们的说法。

(5) GDP 店铺数 (散点图 + 回归直线)

sns.set(style='darkgrid',color_codes=True,font="simhei")
sns.regplot(x='GDP(亿元)',y='mc_count',data=df5,color='r')
plt.savefig('E:\\frame\\数据集\\麦当劳店铺数据\\GDP店铺数.png')

从图看出,GDP与麦当劳店铺数呈正相关,一个城市的GDP是衡量一个城市经济水平的因素,由此也可以看出GDP还能衡量一个城市是否能够吸引更多的像麦当劳一样的企业进驻该城市。

总结:

1、麦当劳店铺数的多少与城市等级有关,城市等级越高,店铺数量越多,像“北上广深”等一线城市,麦当劳店铺数都在100以上。
2、麦当劳店铺数的多少与城市人口的关联不是很大,人口数量在0-500万左右时,麦当劳店铺基本不超过50家。
3、麦当劳店铺数的多少与城市的 GDP 有关,GDP代表一个城市的经济水平,GDP越高说明城市经济水平越高,那么像麦当劳这样的企业就会越多。

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!