数据可视化 | 五常纸面实力历年变化与对比
Posted Charles的皮卡丘
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据可视化 | 五常纸面实力历年变化与对比相关的知识,希望对你有一定的参考价值。
导
语
最近的热搜让我对五常的纸面实力产生了好奇,想必这也是很多人心中好奇的一个点,于是去网上找了些数据,想可视化对比一下五常的GDP,军费支出,科研支出等等数据。本文只进行客观的数据可视化,不会进行主观分析,毕竟数据是死的,人是活的。废话不多说,让我们愉快地开始吧~
完整源代码和数据可以关注微信公众号"Charles的皮卡丘",公众号内回复"五常纸面实力对比"获取。
G
D
P
对
比
五常历年的GDP变化与对比如下所示:
加上印度日本德国这些国家之后的对比结果如下所示:
G
D
P
单
位
能
源
消
耗
对
比
五常历年的GDP单位能源消耗变化与对比如下所示:
加上印度日本德国这些国家之后的对比结果如下所示:
人
均
G
D
P
对
比
五常历年的人均GDP变化与对比如下所示:
加上印度日本德国这些国家之后的对比结果如下所示:
最
高
10%
占
有
收
入
份
额
对
比
五常历年的最高10%占有收入份额变化与对比如下所示:
加上印度日本德国这些国家之后的对比结果如下所示:
军
费
对
比
五常历年的军费变化与对比如下所示:
加上印度日本德国这些国家之后的对比结果如下所示:
人
口
对
比
五常历年的人口变化与对比如下所示:
加上印度日本德国这些国家之后的对比结果如下所示:
人
口
超
过
100
万
的
城
市
群
中
的
人
口
对
比
五常历年的人口超过100万的城市群中的人口变化与对比如下所示:
加上印度日本德国这些国家之后的对比结果如下所示:
科技期刊文章对
比
五常历年的科技期刊文章变化与对比如下所示:
加上印度日本德国这些国家之后的对比结果如下所示:
基
尼
系
数
对
比
五常历年的基尼系数变化与对比如下所示:
加上印度日本德国这些国家之后的对比结果如下所示:
二
氧
化
碳
排
放
量
对
比
五常历年的二氧化碳排放量变化与对比如下所示:
加上印度日本德国这些国家之后的对比结果如下所示:
耗电量对
比
五常历年的耗电量变化与对比如下所示:
加上印度日本德国这些国家之后的对比结果如下所示:
汽油的市场价格对
比
五常历年的汽油的市场价格变化与对比如下所示:
加上印度日本德国这些国家之后的对比结果如下所示:
研究人员数量对
比
五常历年的研究人员数量变化与对比如下所示:
加上印度日本德国这些国家之后的对比结果如下所示:
国际旅游入境人数对
比
五常历年的国际旅游入境人数变化与对比如下所示:
加上印度日本德国这些国家之后的对比结果如下所示:
可再生能源发电量对
比
五常历年的可再生能源发电量(不包括水电)变化与对比如下所示:
加上印度日本德国这些国家之后的对比结果如下所示:
森林面积
对
比
五常历年的森林面积变化与对比如下所示:
加上印度日本德国这些国家之后的对比结果如下所示:
外债总额存量对
比
五常历年的外债总额存量变化与对比如下所示:
加上印度日本德国这些国家之后的对比结果如下所示:
移
民
对
比
五常历年的移民变化与对比如下所示(小于0的按0处理):
加上印度日本德国这些国家之后的对比结果如下所示:
总储备对
比
五常历年的总储备(包括黄金)变化与对比如下所示:
加上印度日本德国这些国家之后的对比结果如下所示:
更多
代码截止2022-03-02测试无误。
本人知乎账号:
白露未晞me,主页:https://www.zhihu.com/people/charles_pikachu
B站账号:
白露未晞me,主页:https://space.bilibili.com/406756145
想加入微信公众号交流群的,后台回复“交流群”即可。
微信公众号:
Charles的皮卡丘
哈哈哈哈哈
长按二维码关注
数据可视化分析历年电影票房(数据读取过滤分类绘图)
本次案例主要用到numpy,pandas和matplotlib。期中pandas中的groupby分组方法较为重要,matplotlib中可以对画图进行更详细的设置,比如设置x、y轴刻度、折线宽度和样式以及颜色等等。
如图部分所示,这是一个关于对历年电影的数据,期中包括电影名称,年份、导演、票房收入等等。
(1)读取文件、处理缺省值
import numpy as np import pandas as pd from matplotlib import pyplot as plt import matplotlib #读取数据 data = pd.read_csv(‘movie_metadata.csv‘) print(data.head())#读取数据前五行 print(data.shape)#打印数据的形状 效果如图所示,可以看到第4行有出现一些空值,这对我们做分局分析是不利的,接下来还需对数据中的空值做处理,清洗。: #处理缺省值,把一些空值进行滤除 data = data.dropna(how = ‘any‘) print(data.head())
(2)统计、分组
#查看票房收入统计 group_director= data.groupby(‘director_name‘)[‘gross‘].sum()#根据director_name进行分组,然后求gross列的和 #print(group_director.head()) #排列 result = group_director.sort_values(ascending=False)#按照降序方法进行排列 print(result) #sort_values函数参数使用: #ascending 是否按指定列的数组升序排列,默认为True,即升序排列 #inplace 是否用排序后的数据集替换原来的数据,默认为False,即不替换
效果如下,途中可以看出票房收入最高的是“Steven Spielberg(史蒂文·斯皮尔伯格)”,总的票房输入是4.114233e+09。
(3)
#电影产量年份图 movie_year = data.groupby(‘title_year‘)[‘movie_title‘].count() #计算每年的电影产量 #print(movie_year.index.tolist()) #print(movie_year.values.tolist()) #为x、y坐标赋值 x = (movie_year.index.tolist()) #把index索引值拿出来作为x轴,也就是年份,以列表形式输出。 y = movie_year.values.tolist()#把values值作为y轴,也就是每年的电影量的和。 #设置画布格式 #plt.xticks(range(len(x),10)) plt.figure(figsize=(20,8),dpi = 80) #设置画布大小为20,8,分析率为80. my_font=matplotlib.font_manager.FontProperties(fname=r‘C:WindowsFontssimsun.ttc‘,size = 18)#设置字体 #设置坐标轴标签 plt.xlabel(‘时间‘,fontproperties = my_font) #设置x轴标签 plt.ylabel(‘电影量‘,fontproperties = my_font)#设置y轴标签 plt.title(‘电影产量年份图‘,fontproperties = my_font,color = ‘red‘)#设置标题名称 #绘制折线图 plt.plot(x,y) plt.show()
具体效果如下,
以上是关于数据可视化 | 五常纸面实力历年变化与对比的主要内容,如果未能解决你的问题,请参考以下文章