Python爬虫1-----urllib模块

1、加载urllib模块的request

from urllib import request

webpage=request.urlopen(url，timeout=1) 【读取网页,参数timeout表示1秒之后为超时，遇到无效网页时可以跳过】
data=webpage.read() 【读取页面内容】

　　【使用webpage.read()读取的页面内容text内容为bytes-object，打印内容为b’……‘】

　　【text为bytes-object，将其转换为字符串text.decode()，默认参数为空，也可使用编码方式参数，格式为decode(“gb2312”)。】

　　res=re.compile(pat).findall(str(data))【记得str(data)】

　　【无法直接使用到re.search()，使用前需要转换为string类型。res就是获取的内容】

（7）（可以查一下llib.request.Request函数）post和get请求

来源：https://www.cnblogs.com/Lee-yl/p/9010759.html

标签

易学教程内所有资源均来自网络或用户发布的内容，如有违反法律规定的内容欢迎反馈！
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!