pyquery介绍
pyquery库是jQuery的Python实现,能够以jQuery的语法来操作解析 HTML 文档,易用性和解析速度都很好,和它差不多的还有BeautifulSoup,都是用来解析的。
引入
from pyquery import PyQuery as pq
初始化为pyquery对象
对字符串进行初始化
doc = pq(html)
看一下doc的类型及内容:
print(type(doc))
print(doc)
选择标签
常用CSS选择器
data = doc('.class1 .class2')
伪类选择器
查找标签
获取标签内容
提取属性值
data = doc('').attr('href')
提取文本
data = doc('').text();
来源:CSDN
作者:wxc0914
链接:https://blog.csdn.net/qq_37055438/article/details/104091989