可视化随笔 奥运会数据集实验心得
Posted Aurora1217
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了可视化随笔 奥运会数据集实验心得相关的知识,希望对你有一定的参考价值。
1.题目
参赛者男女比例组成情况(用groupby函数根据年龄分组计数,并用pyecharts绘制饼图)
2.数据集介绍
运动员赛事数据集 athlete_events.csv
3.代码实现:
import numpy as np
import pandas as pd
from pyecharts.charts import Pie
from pyecharts import options as opts
ath = pd.read_csv("athlete_events.csv")
#根据Sex分组并按ID计数 Series对象
data = ath.groupby(ath["Sex"])["ID"].count()
#Series转换成dict对象最后转换成DataFrame对象
dict_data = {"sex":data.index,"numbers":data.values}
res_data = pd.DataFrame(dict_data)
#DataFrame转换画饼图要的data_pair
data_pair = [list(z) for z in zip(res_data.sex,res_data.numbers)]
pie = (
Pie()
.add("sex",data_pair)
.set_global_opts(title_opts=opts.TitleOpts(title = "参赛者男女比例组成情况",
pos_left="center"),
legend_opts=opts.LegendOpts(pos_left="left",
orient="vertical",
)
)
)
pie.render("sex.html")
Series对象转换成DataFrame对象
可以使用.to_frame()直接将Series转换成DataFrame对象
但是如果index也需要,可以将Series对象转换成dict对象最后转换成DataFrame对象,就可以把下标也转换成一列,方便使用index那一列
4.代码结果
以上是关于可视化随笔 奥运会数据集实验心得的主要内容,如果未能解决你的问题,请参考以下文章
个推0代码数据可视化实操 | 基于Tableau的中国奥运数据探索
Pyecharts“可视化大屏“,带你重温 “2020东京奥运会“,不看直播尽知其事!