444
泉州信息工程学院 软件学院 课程设计报告书 课 程 名: Python课程项目 课程设计项目名称: Python链家爬虫设计 班 级: 16软件工程3班 学 号: 20160850 姓 名: 占坤辛 一、项目简介 1.1项目博客地址 https://blog.csdn.net/qq_44036133/article/details/103661011 1.2项目完成的功能与特色 成功的爬到链家网的数据,生成CSV文件保存数据,并对爬到的数据进行可视化分析绘制成柱状图 箱型图和核密度图 二、自己负责的模块 2.1 自己负责模块列表 爬虫程序的代码书写,材料的查找 2.2 各模块详细描述(名称,功能,运行截图,关键源代码) 数据的爬取: 关键代码: headers = {‘User-Agent’:‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36’} #获取索引页的源代码 def get_page_index(url): try: response = requests.get(url,headers = headers) #get请求方式获取 if response.status_code == 200: