python访问web的利器:urllib2
使用Python访问网页主要有三种方式: urllib, urllib2, httplib urllib比较简单,功能相对也比较弱,httplib简单强大,但好像不支持session 1. 最简单的页面访问 res=urllib2.urlopen(url) print res.read() 2. 加上要get或post的数据 data={"name":"hank", "passwd":"hjz"} urllib2.urlopen(url, urllib.urlencode(data)) 3. 加上http头 header={"User-Agent": "Mozilla-Firefox5.0"} urllib2.urlopen(url, urllib.urlencode(data), header) 使用opener和handler opener = urllib2.build_opener(handler) urllib2.install_opener(opener) 4. 加上session cj = cookielib.CookieJar() cjhandler=urllib2.HTTPCookieProcessor(cj) opener = urllib2.build_opener(cjhandler) urllib2.install_opener(opener) 5.