Tinyproxy

Python爬虫进阶七之设置ADSL拨号服务器代理

北城余情 提交于 2020-01-07 07:19:50
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 那夜 那是一个寂静的深夜,科比还没起床练球,虽然他真的可能不练了。 我废了好大劲,爬虫终于写好了!BUG也全部调通了!心想,终于可以坐享其成了! 泡杯茶,安静地坐在椅子上看着屏幕上一行行文字在控制台跳出,一条条数据嗖嗖进入我的数据库,一张张图片悄悄存入我的硬盘。人生没有几个比这更惬意的事情了。 我端起茶杯,抿了一口,静静地回味着茶香。 这时,什么情况!屏幕爆红了!爆红了!一口茶的功夫啊喂! 怎么回事!咋爬不动了,不动了!我用浏览器点开那一个个报错的链接,浏览器显示 您的请求过于频繁,IP已经被暂时封禁,请稍后再试! 沃日,我IP被封了?此时此刻,空气凝固了,茶也不再香了,请给我一个爱的抱抱啊。 时候不早了,还是洗洗睡吧。 次日 那一晚,辗转反侧难以入睡。 怎么办?怎么办?如果是你你该怎么办? 手动换个IP?得了吧,一会又要封了,还能不能安心睡觉啊? 找免费代理?可行,不过我之前测过不少免费代理IP,一大半都不好用,而且慢。不过可以一直维护一个代理池,定时更新。 买代理?可以可以,不过优质的代理服务商价格可是不菲的,我买过一些廉价的,比如几块钱套餐一次提取几百IP的,算了还是不说了都是泪。 然而最行之有效的方法是什么?那当然是ADSL拨号! 这是个啥?且听我慢慢道来。 什么是ADSL ADSL

Docker竟然还能这么玩?商业级4G代理搭建实战!

♀尐吖头ヾ 提交于 2019-11-29 19:06:22
时间过得真快,距离这个系列的上一篇文章《商业级4G代理搭建指南【准备篇】》发布的时间已经过了两个星期了,上个星期由于各种琐事缠身,周二开始就没空写文章了,所以就咕咕咕了。 那么在准备篇中,我们了解了一下搭建 4G 代理所需要的软硬件,也知道了各种选择的优劣势。现在,我们就可以开始实际搭建了,相信大家也是期待已久了。 基本思路 从这篇文章的标题中我们可以看出,这一次的搭建方案主要用到的是 Docker,你可能会很好奇,Docker 跟搭建 4G 代理有什么关系吗? 嗯,关系很大,我们把整件事情梳理一下,先来看看搭建 4G 代理时的基本流程: 调用网卡拨号,拨号成功后会创建一个虚拟网卡。(正常情况下使用这个虚拟网卡就能上网了) 在多网卡的情况下,重复第一步,会得到多个虚拟网卡。 启动代理服务器,使其使用虚拟网卡作为出网网卡,并使用接入内网的实体网卡作为入网网卡。 但是呢,有个问题,根据我之前的测试结果来看,目前在 Linux 环境下还没有一个 HTTP 代理服务器是可以做到分别指定出网网卡和入网网卡的,嗯...这就很麻烦了,因为如果我们无法这么做的话,就会出现类似于下面这样的问题: 出网和入网都在虚拟网卡上,使用代理服务器必须要走公网访问。 入网为实体网卡,但出网被代理服务器锁定为了某一个,无法利用到多网卡。 嗯...那么不用 HTTP 代理服务器,用那些经常被用来做一些骚操作的

轻量级 HTTP(s) 代理 TinyProxy

喜你入骨 提交于 2019-11-27 16:50:34
CentOS 下安装 TinyProxy yum install -y tinyproxy 启动、停止、重启 # 启动 service tinyproxy start # 停止 service tinyproxy stop # 重启 service tinyproxy restart 相关配置 默认配置文件路径 /etc/tinyproxy/tinyproxy.conf 允许所有人使用代理,注释 Allow 127.0.0.1 # Allow 127.0.0.1 修改监听端口号, 默认 8888 Port 1234 代理请求过滤,示例:仅允许代理请求 anoyi.com 的内容,配置如下: # 指定过滤内容的文件位置 Filter "/etc/tinyproxy/filter" # 使用 URL 过滤而不是 domains FilterURLs On # 允许代理过滤文件里的地址,若不允许,此处设置为 No FilterDefaultDeny Yes 然后在 /etc/tinyproxy/filter 文件添加如下内容: anoyi.com 查看代理请求日志 tail -f /var/log/tinyproxy/tinyproxy.log 应用场景 请求国外的资源,例如 谷歌,youtube 。。。 参考文档 TinyProxy Documentation 来源: https:/