个推0代码数据可视化实操 | 基于Tableau的中国奥运数据探索
Posted 个推技术
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了个推0代码数据可视化实操 | 基于Tableau的中国奥运数据探索相关的知识,希望对你有一定的参考价值。
8月8日,东京奥运会正式落下帷幕。经过17天的激烈角逐,中国代表团在本届奥运会上共斩获38金32银18铜,位居奖牌榜第二,追平了在伦敦奥运会取得的境外参赛最好成绩。
奥运会期间,奖牌榜上的每一次变动都牵动着全国人民的心。在为奥运健儿们取得好成绩欢呼、呐喊的同时,我们也对中国代表团从1984年重返奥运会以来的近十届夏季奥运会“掘金史”进行了回顾。基于开源和公开数据,我们使用数据可视化分析工具Tableau对中国奥运相关数据进行了可视化探索。以下是我们进行数据探索的过程和结果。
数据预处理
数据源说明
我们使用的开源数据来自Kaggle,数据源地址:https://www.kaggle.com/heesoo37/120-years-of-olympic-history-athletes-and-results。这份数据对历届奥运会上各国运动员的相关情况进行了描述,包括姓名(Name)、性别(Gender)、年龄(Age)、身高(Height)、体重(Weight)、国籍(Team)、参赛项目(Sport)、比赛成绩(Medal)等字段。同时,我们也根据公开数据,将2021年东京奥运会上中国代表团的相关数据进行了补充。
数据预处理过程
-
首先,我们根据国籍(Team)字段从开源数据中筛选、导出中国运动员相关数据;
-
根据预先拟定的数据分析维度,在Hive中创建新表,然后将导出的离线数据插入到新建表中;
-
针对Gender、Age、Year、Sport、Medal等相关字段对源数据进行预处理,包括空值填充、同义字段整合、无效字段剔除等操作;
-
基于数据展示需求,对相关字段进行分组、聚合、去重等计算操作,为可视化分析做好数据支撑。
数据探索结果及可视化呈现
温馨提示
关注个推技术实践微信公众号
回复关键字“奥运”
即可下载文中所有可视化图表
01
中国队的优势项目有哪些?数据来说话
从1984年到2021年的37年里,中国体育事业不断发展,中国代表团参加的奥运项目类型愈加丰富。
如此多的奥运项目中,哪些属于中国代表团的优势项目呢?我们对各大类奥运项目下的中国冠军人数进行了统计。
数据显示,跳水、举重、排球、体操、乒乓球、羽毛球、射击等七大类项目的奥运冠军人数均超过20,进入Top7。可见,我们的数据分析结果和大众的常规认知还是比较相符的。被称为“梦之队”的中国跳水队,彰显大国力量的中国举重队,以“女排精神”始终激励和鼓舞国人的排球女将,动作堪称“教科书级别”的中国体操队,被称为“地表最强”的中国乒乓天团……他们的实绩真的都很“能打”,无愧网友们的一声“yyds”!
02
中国已在21个奥运大类项目上实现金牌“零”的突破
在保持这些优势项目竞争力的同时,中国奥运事业全面开花。历经10届奥运会,中国代表团已经在21个奥运大类项目上实现了金牌“零”的突破。
其中,中国重返奥运赛场所参加的第一届奥运会——1984年洛杉矶奥运会,是中国实现奥运大类项目金牌“零”突破数量最多的一届;2008年北京奥运会上,中国代表团在蹦床、帆船、拳击、射箭、赛艇等5个奥运大类项目上实现了“零”金牌的突破,也是收获颇丰的一届。今年的东京奥运会,中国代表团再接再厉,在女子标枪、女子铅球、女子4×200米自由泳接力、男子200米混合泳、女子400米自由泳、女子500米双人划艇、男子单人皮划艇、三人篮球、女子重剑等奥运细分项目上均实现了金牌“零”的突破,创造了新的辉煌!
03
巾帼从来不让须眉!中国奥运军团女性力量崛起
数据显示,除2008年北京奥运会,参赛的中国女性运动员人数略低于男性运动员人数以外,自1992年巴塞罗那奥运会,中国代表团中女性运动员的数量就持续超过男性运动员的数量。2021年东京奥运会,中国代表团男女运动员人数占比相差更为明显:中国代表团共派出运动员431人,其中女运动员298人,占比近70%,人数是男运动员的两倍多。
数据分析结果还表明,中国奥运冠军中的女性运动员占比超5成,达64%。截止2021年东京奥运会,中国代表团中共有184名女运动员成为奥运冠军,数量远超男性运动员。今年的东京奥运会上,中国奥运军团的首日三金得主更是均为女将:分别是女子10米气步枪冠军杨倩、女子举重49公斤级冠军侯志慧、女子重剑冠军孙一文。中国姑娘了不起!
04
24岁是运动员的黄金年龄,最大“夺金”年龄差为30岁
通过对中国奥运健儿获得奖牌时的年龄进行综合统计,我们发现中国运动员在24岁时收获的金牌数量和奖牌数量都是最多的。由此来看,24岁是中国运动员的黄金年龄。
而对比中国运动员获得奥运金牌时的年龄最大值和最小值,我们发现,中国奥运冠军的“夺金”年龄差最大竟达30岁!在2004年雅典奥运会上,43岁的中国射击运动员王义夫获得男子10米气手枪冠军,创造了中国奥运的最大夺金年龄纪录。而中国奥运的最小夺金年龄纪录由“跳水皇后”伏明霞创造。1992年巴塞罗那奥运会上,13岁的伏明霞成为女子10米跳台冠军,创造了世界跳水届的传奇。
05
参加奥运会届数最多的是王义夫,射击运动员的比赛生涯更长
我们还对中国运动员参加奥运会的届数进行了统计分析。数据显示,一共有30名运动员参加过3届以上的奥运会。其中,"中国射击教父"王义夫参加的奥运会届数最多,一共参加了6届,拿下了两枚奥运金牌。
结合运动项目来看,我们发现,多次“出征”奥运会的运动员中,以射击运动员数量最多。这也从侧面反映出,相比较其他奥运项目的运动员,射击运动员拥有更长的比赛生涯。
06
21名运动员拿过至少3枚金牌,4人并列中国运动员奥运金牌榜第一
通过对每个运动员获得的金牌数量进行分析,我们发现,截止到2021年东京奥运会,一共有21名中国运动员获得过至少3枚奥运金牌。
获得奥运金牌数量最多的运动员是吴敏霞、陈若琳、邹凯和马龙,他们都获得过5枚奥运金牌。值得一提的是,国乒队长马龙于今年东京奥运会上收获了乒乓球男子单打、男子团体共两枚奥运金牌,累计夺金5枚,成功占据中国运动员奥运金牌榜的Top位置。
总结
以上,是我们对近十届夏季奥运会上中国代表团夺金数据进行可视化分析的过程和结果。此次数据探索过程实现了0代码,更侧重在对数据的趣味分析和人文解读等方面。
2021年东京奥运会虽然已经结束,但拼搏奋进的奥运精神将永远传承,数据的魅力也将持续彰显。如果你也对数据奥秘充满好奇,也想通过数据解读生活、了解世界,就快快加入我们吧!
个推 2022届校园招聘 全面开启
作为一家数据智能上市企业,每日互动(个推)拥有万亿级数据沉淀,技术实力领先,一直走在大数据和人工智能赛道的最前沿。我们十分期待优秀的你加入,一起扬帆星辰大海,共赴数智未来!
个推2022届校园招聘,快来了解一下吧!
以上是关于个推0代码数据可视化实操 | 基于Tableau的中国奥运数据探索的主要内容,如果未能解决你的问题,请参考以下文章
tableau实战系列(四十七)-Tableau快速生成可视化视图
tableau实战系列(四十七)-Tableau快速生成可视化视图
今日好书丨《数据可视化与数据挖掘——基于Tableau和SPSS Modeler图形界面》
每周一本书之《数据可视化与数据挖掘》:基于Tableau和SPSS Modeler图形界面