Python爬虫学习笔记8:APP的爬取
说明:本学习笔记主要参考:Python3网络爬虫开发实战一书 常用的抓包软件有WireShark、Charles、Fildder、mitmproxy、AnyProxy等。 原理:通过设置代理的方式将手机处于抓包软件的监听之下,获取APP运行的过程中发生的所有请求及响应,如果请求的URL及参数有规律,用程序模拟爬取即可。如果没有,可以利用mitmdump对接Python脚本直接处理Response,还可以利用APPium 进行自动化爬取控制。 一、Charles 下载地址:https://www.charlesproxy.com/download/ 证书配置:SSL证书是为了通过HTTPS协议,Charles客户端和手机都要同时转有SSL证书。 mac Help-ssl proxying - install charles root certificate 选择始终信任。 设置手机证书配置 先开启Charles代理,proxy-proxy settings 将手机同电脑连在同一个局域网下面。 查看本机IP地址,终端输入:ifconfig 安卓手机如何设置代理参考:https://blog.csdn.net/songzi1228/article/details/89950109 设置好代理后,charles界面会有提示,点击allow即可。 下面就是在手机上安装ssl证书