1-代理池(ProxyPool)-Redis+Flask维护动态代理池
1、分析 (1)为什么使用代理池? 许多网站上有专门的反爬虫措施,可能遇到封IP等问题 互联网上公开了大量免费代理,利用好资源 通过定时的检测维护同样可以得到多个可用代理 (2)代理池的需求 多站抓取 异步检测 定时筛选 持续更新 提供接口 易于提取 (3)代理池的框架 2、文件夹中的分布 3、各个代码的内容以及作用 (3-1)README.md # ProxyPool此代理池在获取IP的时候使用了pop方法一次性使用,如果是想多次可用可以移步优化后的代理池:[https://github.com/Python3WebSpider/ProxyPool],推荐使用。 ## 安装 (1)安装Python,至少Python3.5以上 (2)安装Redis,安装好之后将Redis服务开启 ## 配置代理池 进入proxypool目录,修改settings.py文件:PASSWORD为Redis密码,如果为空,则设置为None ## 安装依赖 aiohttp>=1.3.3 Flask>=0.11.1 redis>=2.10.5 requests>=2.13.0 pyquery>=1.2.17 ## 打开代理池和API 直接运行:run.py ## 获取代理:利用requests获取方法如下 import requests PROXY_POOL_URL = 'http://localhost