2020不平凡的90天,Python分析三个月微博热搜数据带你回顾
前言 文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。 作者:刘早起早起 PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取http://t.cn/A6Zvjdun 北京时间4月3日凌晨,全球新冠病毒感染人数突破100万,死亡人数超过5万。而这一切都在2020年刚开始的三个月内发生。可能你觉得这三个月很快,有些事情已经逐渐忘记,而互联网的记忆不会消失,数据也会说话。因此作者抓取了2020年1月1日至4月2日的每天微博排名前50条热搜共近5000条数据,通过分析微博热搜数据带你回顾这不平凡的90天。 Part1 首先我们制作这三个月全部热搜的词云图 可以看到,疫情下的微博热搜主要以疫情相关词汇组成,我们再根据每一条热搜的热度大小进行排序,得到这三个月中热度最高的十条热搜,猜猜是什么 令人惊讶的的是,在这三个月内的每日热度排名前十的热搜中娱乐相关的热搜为4条,疫情相关热搜为5条。并且第一第二的并不是疫情相关热搜,而是两位明星相关的资讯 Part2 我们接着提取中国各省市在热搜中出现的次数,以此来代表网友对各省的关注度绘制关注度地图与词云图 从热搜出现的省份来看最受关注的还是湖北省,其次是北京、上海、浙江、四川等省市,从热搜出现的城市来看,武汉、广州、北京、杭州、上海等城市出现次数较多。同时值得关注的是