基于 Python 的招聘信息爬虫与可视化分析系统

Posted Python极客之家

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于 Python 的招聘信息爬虫与可视化分析系统相关的知识,希望对你有一定的参考价值。

1. 项目简介

本项目利用 Python 从某招聘网站抓取海量招聘数据,进行数据清洗和格式化后存储到关系型数据库中(如mysql、sqlite等),利用 Flask + Bootstrap + Echarts 搭建招聘信息可视化分析系统,实现不同岗位的学历要求、工作经验、技能要求、薪资待遇等维度的可视化分析,并根据岗位所在地进行不同地域(华东、华北、华中、华南、西南、西北和东北)维度的细粒度分析。同时依据用户需求实现热门岗位的推荐,并利用决策树算法实现岗位薪资的预测。

2. 招聘信息网络爬虫

分析某招聘网站的网页结构和接口可以看出,招聘数据可直接通过接口返回的 json 格式数据直接得到,因此采集相对比较简单了,直接模拟接口请求,对返回的数据进行解析即可。

基于

代码如下:

base_url = https://search.51job.com/list/000000,000000,0000,00,9,99,%25E5%25BC%2580%25E5%258F%2591,2,.html?lang=c&postchannel=0000&workyear=99&cotype=99&degreefrom=99&jobterm=99&companysize=99&ord_field=0&dibiaoid=0&line=&welfare=
datas = []

for page in range(1, total_page + 1):
print(--> 爬取第 页.format(page))
url = base_url.format(page)
headers =
Accept: application/json, text/javascript, */*; q=0.01,
user-agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 11_1_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36,
accept-language: zh-CN,zh;q=0.9,
cache-control: max-age=0,
Cookie: Your Cookie,
Host: search.51job.com,

response = requests.get(url, headers=headers)
items = response.json()[engine_jds]

for item in items:
try:
job_name = item[job_name]
hangye = item[companyind_text]
company = item[company_name]
salary = item[providesalary_text]

location = item[attribute_text][0]
location = location.split(-)[0]
location = location.split(_)[0]

jingyan = item[attribute_text][1]
xueli = item[attribute_text][2]
zhaopin_counts = 1#item[attribute_text][3]
pub_time = item[issuedate]
datas.append((job_name, hangye, company, location, salary, jingyan, xueli, zhaopin_counts, pub_time))
except:
pass

print(爬取了 条就业数据.format(len(datas)))

3. 招聘信息可视化分析系统

3.1 系统注册登录

基于

3.2 招聘数据展示

基于

3.3 各行业招聘岗位数与薪资分布

基于

3.4 不同工作经验的岗位数与平均薪资的分布情况

基于

3.5 不同学历的岗位数与平均薪资的分布情况

基于

3.6 不同区域热招岗位及其薪资分布情况

基于

基于

基于

3.7 热门岗位推荐

基于

3.8 基于决策树模型的岗位薪资价格预测

基于

以上是关于基于 Python 的招聘信息爬虫与可视化分析系统的主要内容,如果未能解决你的问题,请参考以下文章

Python招聘岗位信息聚合系统源码(爬虫爬取数据分析可视化互动等功能)...

基于Python的招聘网站爬虫及可视化的设计与实现

基于大数据的房价数据爬虫与可视化分析预测系统

毕业设计基于大数据的招聘职业爬取与分析可视化

Python毕业设计 大数据招聘网站爬取与数据分析可视化 - flask

基于python的电影数据可视化分析与推荐系统