Python 爬取拉钩网工作岗位

ⅰ亾dé卋堺 提交于 2019-11-29 01:59:43

如果拉钩网html页面做了调整,需要重新调整代码

代码如下

#/usr/bin/env python3
#coding:utf-8
import sys
import json
import requests

"""
Usage:
        python3 lagou.py  <Number> <positionName>

"""

def get_jobs(pn=1,kw="python"):
        url = 'https://www.lagou.com/jobs/positionAjax.json?needAddtionalResult=false'
        payload = {"first":"false","pn":pn,"kd":kw}
        #payload = {'needAddtionalResult':'false'}
        rr = requests.post(url,data=payload)
        #print(r.json())
        jobs_data = rr.json()
        #print(jobs_data["content"]["positionResult"]["result"][0])
        jobs = jobs_data["content"]["positionResult"]["result"]

        for i in jobs:
                print("学历:" + i["education"])
                print("城市:" + i["city"])
        #       print("福利:" + i["companyLabelList"])
                print("薪资:" + i["salary"])
                print("职位:" + i["positionName"])
                print("要求:" + i["positionAdvantage"])
                print("经验:" + i["workYear"])
                print("链接:" + "https://www.lagou.com/jobs/" + str(i["positionId"]) + ".html")
                print()

if __name__ == '__main__':
        #pn表示页数,kw表示关键词搜索
        pn = sys.argv[1]
        kw = sys.argv[2]
        get_jobs(pn,kw)

 

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!