Python酷炫毕业论文案例,对全国大学数据进行可视化分析

Posted yunyun云芸

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python酷炫毕业论文案例,对全国大学数据进行可视化分析相关的知识,希望对你有一定的参考价值。


全国所有大学的数据信息(包括专本科,覆盖全国),一共是获取到了全国31个省份,共2769所大学。

涉及到的内容:
Pandas — 数据处理
Pyecharts — 数据可视化

安装库

pip install pyecharts

1、导入模块

Pandas数据处理
读取数据

import pandas as pd
from collections import Counter
###画图
from pyecharts import options as opts
from pyecharts.charts import Map
from pyecharts.globals import ThemeType
from pyecharts.charts import Bar, Pie, Timeline
from pyecharts.faker import Faker

datafile = u'/home/mw/input/university_data1034/
data = pd.read_excel(datafile)
data.head()

2、不同省份大学数量

###不同省份大学数量
attr = data['省份'].tolist()
result = Counter(attr)
# 排序
d = sorted(result.items(), key=lambda x: x[1], reverse=True)
#print(d)
#for i in d:
#    print(i)
provinces = [i[0] for i in d]
value = [i[1] for i in d]

#print(provinces)
#print(value)
c = (
    Map()
        .add("", [list(z) for z in zip(provinces, value)], "china")
        .set_global_opts(
        title_opts=opts.TitleOpts(title="分段型数据"),
        visualmap_opts=opts.VisualMapOpts(max_=200, split_number=8, is_piecewise=True),
    )
)
c.render_notebook()

3、统计省份对应不同市大学数量

##统计省份对应不同市大学数量

###广东所有城市
gd_city = []
###吉林所有城市
jl_city = []
for index, row in data.iterrows():
    if row[0]=="广东":
        gd_city.append(row[8])
    if row[0]=="吉林":
        jl_city.append(row[8])
print(gd_city)
print(jl_city)

gd_city_res = Counter(gd_city)
jl_city_res = Counter(jl_city)
# 排序
gd_city_res1 = sorted(gd_city_res.items(), key=lambda x: x[1], reverse=True)
jl_city_res1 = sorted(jl_city_res.items(), key=lambda x: x[1], reverse=True)

guangdong_city = [i[0] for i in gd_city_res1]
guangdong_value = [i[1] for i in gd_city_res1]

jilin_city = [i[0] for i in jl_city_res1]
jilin_value = [i[1] for i in jl_city_res1]
c1 = (
    Map()
        .add("广东各市大学数量", [list(z) for z in zip(guangdong_city, guangdong_value)], "广东")
        .set_global_opts(
        title_opts=opts.TitleOpts(title="广东各市大学数量"), visualmap_opts=opts.VisualMapOpts()
    )

).render(path="广东各市大学数量.html")

c2 = (
    Map()
        .add("吉林各市大学数量", [list(z) for z in zip(jilin_city,jilin_value)], "吉林")
        .set_global_opts(
        title_opts=opts.TitleOpts(title="吉林各市大学数量"), visualmap_opts=opts.VisualMapOpts()
    )

)
c.render_notebook()

分段型数据

4、985、211以及双一流

##985、211以及双一流

###985学校
data_985 = []
###211学校
data_211 = []
###双一流学校
data_two_one = []
for index, row in data.iterrows():
    if row[5] == 1:
        data_985.append(row[1])
    if row[6] == 1:
        data_211.append(row[1])
    if row[7] == "双一流":
        data_two_one.append(row[1])
print(len(data_985))
print(len(data_211))
print(len(data_two_one))
key = ['985','211','双一流']
value = [len(data_985),len(data_211),len(data_two_one)]
pie = (
    Pie()
        .add(
        "985、211以及双一流数量",
        [list(z) for z in zip(key, value)],
        rosetype="radius",
        radius=["30%", "55%"],
    )
        .set_global_opts(title_opts=opts.TitleOpts("985、211以及双一流数量"))
).render(path="985、211以及双一流数量.html")
c.render_notebook()

5、公或民办类型数量

###公或民办类型数量

attr = data['公或民办'].tolist()
result = Counter(attr)
# 排序
d = sorted(result.items(), key=lambda x: x[1], reverse=True)
print(d)
key = [i[0] for i in d]
value = [i[1] for i in d]
pie = (
    Pie()
        .add(
        "公或民办类型数量",
        [list(z) for z in zip(key, value)],
        rosetype="radius",
        radius=["30%", "55%"],
    )
        .set_global_opts(title_opts=opts.TitleOpts("公或民办类型数量"))
)
c.render_notebook()
[('公办', 2010), ('民办', 746), ('中外合作办学', 13)]


6、本或专科数量

#本或专科数量

attr = data['本或专科'].tolist()
result = Counter(attr)
# 排序
d = sorted(result.items(), key=lambda x: x[1], reverse=True)
print(d)
key = [i[0] for i in d]
value = [i[1] for i in d]
pie = (
    Pie()
        .add(
        "本或专科类型数量",
        [list(z) for z in zip(key, value)],
        rosetype="radius",
        radius=["30%", "55%"],
    )
        .set_global_opts(title_opts=opts.TitleOpts("本或专科类型数量"))
)
c.render_notebook()
[('专科(高职)', 1461), ('普通本科', 1308)]

7、全国不同大学隶属情况

###全国不同大学隶属情况

attr = data['隶属于'].tolist()
result = Counter(attr)
# 排序
d = sorted(result.items(), key=lambda x: x[1], reverse=True)
print(d)
key = [i[0] for i in d]
value = [i[1] for i in d]
c = (
    Bar(init_opts=opts.InitOpts(theme=ThemeType.DARK))
        .add_xaxis(xaxis_data=key)
        .add_yaxis("数量", y_axis=value)
        .set_global_opts(
        title_opts=opts.TitleOpts(title="全国不同大学隶属情况"),
        datazoom_opts=[opts.DataZoomOpts(), opts.DataZoomOpts(type_="inside")],
    )
        
)
c.render_notebook()

(‘河南省’, 107), (‘江苏省’, 106), (‘山东省’, 106), (‘广东省’, 106), (‘湖南省’, 92),
(‘安徽省’, 88), (‘教育部’, 84), (‘河北省’, 81), (‘湖北省’, 78), (‘辽宁省’, 75),
(‘江西省’, 75), (‘四川省’, 72), (‘浙江省’, 71), (‘山西省’, 67), (‘云南省’, 60),
(‘黑龙江省’, 58), (‘陕西省’, 58), (‘贵州省’, 56), (‘广西壮族自治区’, 51), (‘四川省教育厅’,
51), (‘江苏省教育厅’, 50), (‘福建省’, 49), (‘吉林省’, 44), (‘广东省教育厅’, 44),
(‘内蒙古自治区’, 43), (‘甘肃省’, 43), (‘天津市’, 42), (‘河南省教育厅’, 42), (‘重庆市’, 42),
(‘湖北省教育厅’, 40), (‘北京市’, 38), (‘福建省教育厅’, 37), (‘山东省教育厅’, 37),
(‘新疆维吾尔自治区’, 37), (‘河北省教育厅’, 34), (‘浙江省教育厅’, 34), (‘湖南省教育厅’, 33),
(‘上海市’, 31), (‘陕西省教育厅’, 30), (‘安徽省教育厅’, 29), (‘辽宁省教育厅’, 28),
(‘江西省教育厅’, 28), (‘广西自治区教育厅’, 24), (nan, 22), (‘重庆市教委’, 21), (‘云南省教育厅’,
20), (‘黑龙江省教育厅’, 19), (‘上海市教委’, 18), (‘吉林省教育厅’, 17), (‘北京市教委’, 15),
(‘贵州省教育厅’, 15), (‘宁夏回族自治区’, 14), (‘山西省教育厅’, 13), (‘内蒙古自治区教育厅’, 12),
(‘天津市教委’, 11), (‘海南省’, 11), (‘青海省’, 11), (‘海南省教育厅’, 10), (‘工业和信息化部’,
9), (‘西藏自治区’, 7), (‘新疆生产建设兵团’, 7), (‘新疆自治区教育厅’, 7), (‘公安部’, 6),
(‘国家民委’, 5), (‘交通运输部’, 5), (‘甘肃省教育厅’, 5), (‘解放军总后勤部’, 4), (‘解放军海军’,
4), (‘广西壮族自治区教育厅’, 4), (‘宁夏自治区教育厅’, 4), (‘解放军总参谋部’, 3), (‘应急管理部’, 3),
(‘解放军空军’, 3), (‘山东省人民政府’, 3), (‘中国科学院’, 2), (‘解放军总装备部’, 2), (‘中央统战部’,
2), (‘重庆市教育委员会’, 2), (‘武警总部’, 2), (‘贵州省人民政府’, 2), (‘中华妇女联合会’, 1),
(‘中华全国总工会’, 1), (‘中央办公厅’, 1), (‘国家体育总局’, 1), (‘外交部’, 1), (‘国家卫生健康委员会’,
1), (‘中国社会科学院’, 1), (‘中国共产党中央军事委员会’, 1), (‘中国人民武装警察部队’, 1), (‘中国地震局’,
1), (‘司法部’, 1), (‘邯郸市教育局’, 1), (‘山西医科大学’, 1), (‘山西省卫生计生委’, 1),
(‘山西省监狱管理局’, 1), (‘山西省人民政府’, 1), (‘国家民族事务委员会’, 1), (‘鞍山市人民政府’, 1),
(‘省教育厅’, 1), (‘海关总署’, 1), (‘上海市 中国科学院’, 1), (‘浙江电力公司’, 1),
(‘浙江湖州上墅教育集团’, 1), (‘江西省国资委’, 1), (‘解放军南京军区’, 1), (‘南昌大学’, 1),
(‘江西省人民政府’, 1), (‘解放军战略支援部队’, 1), (‘国家水利部和湖北省人民政府共建大学’, 1), ('湖北省教育厅
', 1), (‘中央军委’, 1), (‘总装备部’, 1), (‘广西壮族自治区人民政府’, 1), (‘重庆市巴南区’, 1),
(‘重庆移通学院’, 1), (‘西南财经大学’, 1), (‘达州市’, 1), (‘四川省人民政府’, 1), (‘四川市教育厅’,
1), (‘贵州省财政厅’, 1), (‘贵州财经大学’, 1), (‘中央军委训练管理部’, 1), (‘解放军火箭军’, 1),
(‘解放军兰州军区’, 1), (‘青海省教育厅’, 1), (‘宁夏回族自治区石嘴山市人民政府’, 1),
(‘克孜勒苏柯尔克孜自治州人民政府’, 1), (‘新疆维吾尔自治区教育厅’, 1)


到这结束,感谢观看,更多Python精彩内容可以关注我,需要获得下面的资料可以私信我获得。
①兼职交流,行业咨询
②Python开发环境安装教程
③Python自学视频
④大佬在线专业解答
⑤Python学习路线图
⑥300多本Python电子书

以上是关于Python酷炫毕业论文案例,对全国大学数据进行可视化分析的主要内容,如果未能解决你的问题,请参考以下文章

python系统学习4——多个爬虫测试案例

急求近年全国大学生数学建模大赛论文,有无获奖均可

数据挖掘:扩招十八年 大学生就业十二变

年近30------职业回顾与思考

年近30------职业回想与思考

大学生KAB创业基础(学生用书)(修订版)共青团中央 中华全国青年联合会 等课后答案