拉勾网

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了拉勾网相关的知识,希望对你有一定的参考价值。

requests模块报错无属性get:文件名与某个Python库名相同
****************************************分割线****************************************
拉勾网深圳的Python工作:
 
import requests
from openpyxl import Workbook
 
info=[]
s=requests.session()
s.get(‘https://www.lagou.com/jobs/list_Python?fromSearch=true‘)
s.cookies[‘LGUID‘]=s.cookies[‘user_trace_token‘]    #反爬の行为分析:访问4页之后添加个LGUID
 
headers={‘User-Agent‘:‘Mozilla/5.0 Chrome/61.0.3163.100 Safari/537.36‘,
         ‘Referer‘:‘https://www.lagou.com/jobs/list_Python?fromSearch=true‘}
url=‘https://www.lagou.com/jobs/positionAjax.json‘
for page in range(1,10):
    print(‘begin to handle page of %s‘ %page)
    data=dict(city=‘深圳‘,kd=‘Python‘,pn=‘%s‘ %page)
    response=s.post(url,data=data,headers=headers).json()
    jobs=response[‘content‘][‘positionResult‘][‘result‘]
    for job in jobs:
        workplace=job[‘city‘]
        salary=job[‘salary‘]
        positionName=job[‘positionName‘]
        industryField=job[‘industryField‘]
        companySize = job[‘companySize‘]
        shortName=job[‘companyShortName‘]
        fullName=job[‘companyFullName‘]
        companyLabelList=‘,‘.join(job[‘companyLabelList‘])
        info.append([workplace,salary,positionName,industryField,\
                     companySize,shortName,fullName,companyLabelList])
 
wb = Workbook()
ws = wb.active
ws.append([‘城市‘,‘薪资‘,‘职位‘,‘领域‘,‘规模‘,‘简称‘,‘全称‘,‘福利‘])
for x in info:
    ws.append(x)
wb.save(‘E:\拉勾网.xlsx‘)
****************************************分割线****************************************
666

以上是关于拉勾网的主要内容,如果未能解决你的问题,请参考以下文章

狗日的,拉勾网

拉勾网

网络爬虫-爬取拉勾网不成功,登录设置cookie

你的方向值多少钱?从拉勾网数据看目前IT市场行情

Python 爬取拉勾网python职位信息

python3 爬取拉勾网1