利用python爬出《庆余年》中,你不知道的秘密

最后都变了- 提交于 2019-12-20 02:52:18

一转眼到了年末了,不少人开始“囤”钱买年货,不过因为《庆余年》的出现,不少人爆肝追剧,甚至超前点播,总之,根据经典IP,人气爆棚的小说改编的《庆余年》,网友们可谓是寄予厚望。

暑期档后处于“退潮期”的古装剧,在年末开启了复苏模式,尤其《庆余年》从开播以来,热搜真的下不去呀,如#郭麒麟承包庆余年笑点#、#老戏骨斗嘴#、#叶轻眉的故事#、 #陈萍萍是个狼人#等,几乎只要《庆余年》更新,第二天热搜决定榜首第一, 豆瓣评分也有8.0的高分,实属难见。
在这里插入图片描述
如今关于庆余年的讨论声也逐渐增长,不仅有网友们神评论,不少明星也一直关注着,活不多说,现在小编利用python来爬一爬明星的评论:
在这里插入图片描述
一条条看显然不符合数据分析师身份
于是爬取了微博超话页面,然后找到相关人员,分别去爬取相关人员的微博评论,看看大家都在讨论啥。
import argparse
parser = argparse.ArgumentParser(description=“weibo comments spider”)
parser.add_argument(’-u’, dest=‘username’, help=‘weibo username’, default=’’) #输入你的用户名
parser.add_argument(’-p’, dest=‘password’, help=‘weibo password’, default=’’) #输入你的微博密码
parser.add_argument(’-m’, dest=‘max_page’, help=‘max number of comment pages to crawl(number larger than 0 or all)’, default=) #设定你需要爬取的评论页数
parser.add_argument(’-l’, dest=‘link’, help=‘weibo comment link’, default=’’) #输入你需要爬取的微博链接
parser.add_argument(’-t’, dest=‘url_type’, help=‘weibo comment link type(pc or phone)’, default=‘pc’)
args = parser.parse_args()
wb = weibo()
username = args.username
password = args.password
try:
max_page = int(float(args.max_page))
except:
pass
url = args.link
url_type = args.url_type
if not username or not password or not max_page or not url or not url_type:
raise ValueError(‘argument error’)
wb.login(username, password)
wb.getComments(url, url_type, max_page

看到这些代码,许多人还处于蒙圈的状态吧,小编也一样,对于新手小白来说,这东西堪比数理化呀,不过看了下面这几点,你对python大有改观。

01、python语言简洁、优雅,所以和ta是没有沟通障碍的;
02、python多才多艺,目前已广泛应用于人工智能、云计算开发、大数据开发等;
03、学习python,可以爬虫获取年度网络流行语,无论你从事哪一行都能挖掘到你想要的数据,从此“踏平坎坷成大道”。

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!