requests模块介绍
一.requests模块 (1)requests模块的get方法 1、response = requests.get( url=请求url地址, headers = 请求头字典, params=请求参数字典 , ) 2、get请求一般带参数,带参数就将参数封装到params字典中就可以了。 案例:新浪新闻,两种分装params请求参数方式 3、response对象 (1)响应正文: a、字符串格式的响应正文:response.text b、字节类型(bytes)的响应正文:response.content (2)响应正文的乱码问题解决: a、encode和decode就是二进制和字符串之间转换方法。 编程里面数据载体 存储用变量或者常量 可以看到数据的内容一定是字符串格式。 正常的计算机数据本质都是二进制–bytes。 str.encode(‘编码’)—>bytes bytes.decode(‘编码’)---->str 乱码:编码不一致造成的 。 response.content.decode(‘页面的正确编码’)—得到页面正确的字符串内容 b、response.text之所以可以获取字符串格式,其实在requests模块的底层用 response.encoding这个属性所对应的编码来将二进制内容变成字符串。其实就是response.encoding所对应的编码错了