十Python之Http Web服务(网页抓取二)
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 上一篇讲了网页抓取的基础,分析html,但是我们所得到的html内容必须是通过编程的方式获取到的。 简单地讲,HTTP web 服务是指以编程的方式直接使用 HTTP 操作从远程服务器发送和接收数据。P ython3 带有两个库用于和HTTP web 服务交互: http.client 是实现了RFC 2616, HTTP 协议的底层库。 urllib.request 建立在http.client之上一个抽象层。 它为访问HTTP 和 FTP 服务器提供了一个标准的API,可以自动跟随HTTP 重定向, 并且处理了一些常见形式的HTTP 认证。 1. 一个简单的http 服务请求 import urllib.request as request if __name__ == '__main__': response = request.urlopen("http://www.baidu.com") data = response.read() print(type(data)) # <class 'bytes'> print(data) #输出字节码内容 print(str(data,encoding = "utf-8")) #将字节码转换成utf-8编码的字符串 (1)在Python中操作http