爬去拉勾网招聘信息
https://blog.csdn.net/xiaoduan_/article/details/80835231 在拉勾网发现他们招聘信息的返回接口是json接口,有这样好的数据接口怎么能不爬那。 平时比较喜欢spark,那就来爬spark的招聘信息然后放到MongoDB里面吧 #!/usr/bin/env python3 # -*- coding: utf-8 -*- # @Author : Anthony_Duan # @Time : 25/06/2018 15:53 # @File : lagou.py # @Software: PyCharm import requests from fake_useragent import UserAgent import time from pymongo import MongoClient client = MongoClient() db = client.lagou # 连接数据库,如果没有该数据库就创建一个 my_set = db.spark_job # 定义lagou数据库下的job表 没有自动创建 headers = { "Cookie" : "JSESSIONID=ABAAABAAAIAACBICB3D046BA1BEA314A00EA18BD6391426; SEARCH_ID