数据结构化与保存
1. 将新闻的正文内容保存到文本文件。 1 2 3 4 def writeNewsDatail(content): f = open ( 'gzccnews1.txt' , 'a' ,encoding = 'utf-8' ) f.write(content) f.close() 2. 将新闻数据结构化为字典的列表: 单条新闻的详情-->字典news 一个列表页所有单条新闻汇总-->列表newsls.append(news) 所有列表页的所有新闻汇总列表newstotal.extend(newsls) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 import pandas import requests import re from bs4 import BeautifulSoup from datetime import datetime def writeNewsDatail(content): f = open (