今天准备进行北京市政府信件列表界面信息的爬取,通过老师给的教程发现界面的跳转网址不会发生改变,原来的思路不可用,查询资料可以使用geckodeiver来驱动网页的自动跳转。参考博文:https://www.cnblogs.com/nuomin/p/8486963.html。
其次学习了爬取中需要用到的css选择器的使用。初步了解了爬虫的思路。
来源:https://www.cnblogs.com/1061321925wu/p/12250666.html
今天准备进行北京市政府信件列表界面信息的爬取,通过老师给的教程发现界面的跳转网址不会发生改变,原来的思路不可用,查询资料可以使用geckodeiver来驱动网页的自动跳转。参考博文:https://www.cnblogs.com/nuomin/p/8486963.html。
其次学习了爬取中需要用到的css选择器的使用。初步了解了爬虫的思路。
来源:https://www.cnblogs.com/1061321925wu/p/12250666.html