网络机器人的识别与攻防的经典案例(也即爬虫与反爬虫的经典案例)
本文我们介绍一个网络机器人的识别与攻防的经典案例(也即爬虫与反爬虫的经典案例)。使用到的 代码见本人的 superword 项目: https://github.com/ysc/superword/blob/master/src/main/java/org/apdplat/superword/tools/ProxyIp.java 我们的目的是要使用机器人自动获取站点 http://ip.qiaodm.com/ 和站点 http://proxy.goubanjia.com/ 的免费高速HTTP代理IP和端口号。 不过他们未对机器人进行识别,如通过如下代码就可以获取网页内容: public static void main(String[] args) { try { String url = "http://proxy.goubanjia.com/"; HttpURLConnection connection = (HttpURLConnection)new URL(url).openConnection(); connection.setConnectTimeout(10000); connection.setReadTimeout(10000); connection.setUseCaches(false); BufferedReader reader = new