python urllib模块
在python中urllib模块提供上层接口,可以使用它下载读取数据,这里举个例子,把sina首页的html抓取下来显示出来.有2种方法可以实现. 1.urlopen(url, data=None, proxies=None) urlopen(url [, data]) -> open file-like object 创建一个表示远程url的类文件对象,然后像本地文件一样操作这个类文件对象来获取远程数据。参数url表示远程数据的路径,一般是网址;参数data表示以post方式提交到url的数据;参数proxies用于设置代理.urlopen返回一个类文件对象. #!/usr/bin/python2.5 import urllib url = "http://www.sina.com" data = urllib.urlopen(url).read() print data root@10.1.6.200:~# python gethtml.py <!Doctype html> <!--[30,131,1] published at 2013-04-11 23:15:33 from #150 by system--> <html> <head> <meta http-equiv="Content-type" content="text/html; charset=gb2312" /