Scrapy中的Setting
AJAXCRAWL_ENABLED = False # 自动限速设置 AUTOTHROTTLE_ENABLED = False AUTOTHROTTLE_DEBUG = False AUTOTHROTTLE_MAX_DELAY = 60.0 AUTOTHROTTLE_START_DELAY = 5.0 AUTOTHROTTLE_TARGET_CONCURRENCY = 1.0 # 此Scrapy项目实施的bot的名称(也称为项目名称)。这将用于默认情况下构造User-Agent,也用于日志记录。 BOT_NAME = 'scrapybot' # 一个整数值,单位为秒。如果一个spider在指定的秒数后仍在运行,它将以 closespider_timeout 的原因被自动关闭。 # 如果值设置为0(或者没有设置),spiders不会因为超时而关闭。 CLOSESPIDER_TIMEOUT = 0 # 在抓取了指定数目的Item之后 CLOSESPIDER_PAGECOUNT = 0 # 在收到了指定数目的响应之后 CLOSESPIDER_ITEMCOUNT = 0 # 在发生了指定数目的错误之后就终止爬虫程序 CLOSESPIDER_ERRORCOUNT = 0 COMMANDS_MODULE = '' COMPRESSION_ENABLED = True # 在项处理器