易云音乐

Python爬取网易云音乐评论(附加密算法)

丶灬走出姿态 提交于 2019-11-29 00:50:19
网易云音乐,里面汇聚了哲学家,小说家,story-teller,皮皮虾等各种人才,某些评论非常值得收藏(甚至开了一个歌单专门收藏它们)。竟然这么好玩,何不尝试把他们爬取下来呢? 前置需求 可选:fiddler 捉包工具 (官网下载) 可选:了解一点AES,RSA加密 任一浏览器 pycryptodome模块 (直接pip安装) base64及binascii模块 (直接导入) 可选是指:如果你要深入了解如何找到加密方法,就选 结构分析 我们要爬的是歌曲的评论,而歌曲的来源有多种,有的来源于专辑,有的来源于歌单,有的来源于歌手页;而歌单和专辑的来源又有多种。所以爬取多个歌曲的评论之前,我们要分析一下信息的结构,最好写下来,这样头脑会更清晰减少代码修改量。这里放出一张我自己整理的结构,并选择一条线路来实现(发现音乐→→歌单→→歌曲→→评论) 至于上图所列的其他信息,读者可以过完这个实战后自己动手实现,但是要注意的是:某些信息是无法直接通过网页源码提取出来的,需要通过加密的动态包(其实是API)获得,如果有需要的话我可能会出一篇文章总结网易云音乐的API 收集歌单id 每个歌单都有唯一的id,通过http://music.163.com/playlist… 这个链接就可以找到歌单,所以第一步我们要收集发现音乐下的多个歌单id ''' 遇到不懂的问题?Python学习交流群