Beautiful Soup 解析html表格

匿名 (未验证) 提交于 2019-12-02 20:32:16
from bs4 import BeautifulSoup import urllib.request doc = urllib.request.urlopen('http://www.bkzy.org/Index/Declaration?intPageNo=1') doc = doc.read().decode('utf-8')  soup = BeautifulSoup(doc, "html.parser")  school = 0 pro_code = 1 pro_name = 2 xuewei = 3 pdf = 4   # find_all 查到所有tr列表 for tr in soup.find_all('tr',):  # 在每个tr找td     td = tr.find_all('td')     try:         print('%s_%s_%s_%s.pdf' % (             td[school].text.strip(),             td[pro_code].text.strip(),             td[pro_name].text.strip(),             td[xuewei].text.strip())             ,td[pdf].find('a')['href'])     except IndexError as e:         pass
转载请标明出处:Beautiful Soup 解析html表格
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!