下一站,向冠军冲击!

Posted Datawhale

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了下一站,向冠军冲击!相关的知识,希望对你有一定的参考价值。

↑↑↑关注后"星标"Datawhale

每日干货 & 每月组队学习,不错过

 Datawhale干货 

作者:牧小熊,华中农业大学,Datawhale成员

看到了文章《鱼佬:从数据竞赛到工作》中读者的留言,想结合我自己的体会给大家分享一下数据竞赛的实践心得。

0.内卷的数据竞赛

随着机器学习、人工智能以及深度学习这样的字眼频繁的出现在各种报道中,人工智能的浪潮冲击着各行各业。在这样的背景下,各式各样的数据比赛如雨后春笋般快速发展,越来越多的同学都参与到数据竞赛的比拼中。

一方面参加数据竞赛能够帮助我们提升代码能力,接触业界的真实数据,另一方面数据竞赛也成为应届生求职路上的内卷石。算法岗就不用说了,卷王之王,没打过几场数据竞赛,可能连面试的资格都很难拿到,现在包括一些数据挖掘甚至是数据分析岗也对数据竞赛有一定的要求。比如我曾在某招聘网站看到招数据分析的岗位,明确的要求应聘者要有数据竞赛的经历。

随便一翻就能看到对竞赛的要求

1.从0到1的比赛

去年找实习的艰难之旅,也让我认识到了数据竞赛的重要性。当时联系到了在大厂的师兄帮我内推,尽管师兄很给力,最后却连面试机会都没拿到,没有顶会也没有竞赛,单凭简历就把我拒之门外。师兄建议我抽时间去打一下数据相关的比赛,给我推荐了国外的Kaggle和国内的天池数据平台。

看到了师兄的建议后,感觉确实有打比赛来实践学习的必要,这样一路摸索找到了天池的竞赛界面。

登陆平台,页面是相当的炫酷,我是完全的懵,不知道从哪里入手。这个比赛要怎么参加,怎么打咩?完全不知道怎么操作好吧....

在万能的百度帮助下,终于知道怎么参加比赛提交结果了,可是我好像都不知道怎么对赛题的数据下手。看到比赛论坛上各种大佬发的帖子,上来就是duangduang几十行的代码,于是“CV工程师”上线,把大佬们的代码本地跑一遍就提交了结果。

这就比赛完了?可是大佬们的代码完全都看不明白,甚至连题目都没看懂,这样的比赛经历这也不敢往简历上写啊,数据竞赛入门也太难了......

正在这时,偶然看到了Datawhale的组队学习,刚好就是针对我想要练手的赛题!从赛题理解到数据分析到最后的模型融合,一路学下来,起码了解代码的含义,知道了些机器学习的方法,还把我的学习和思考整理成了文章。

可能是学习的过程比较认真,Datawhale还给我发了一个“优秀学习者”奖和奖品,奖项不大,但的确给了我很大的鼓励~

优秀学习者的奖品(下面的鼠标垫也是)

当时还发了一个朋友圈来表达我开心的心情(๑>؂<๑):

2.从实践到理论学习

入了门,在比赛的过程中,名次却一直徘徊在100多名,不管我怎么调参排名都上不去,才发现实际操作起来,还是有很多问题不知道如何处理。

刚巧阿里天池出了一本讲赛题解析的书《阿里天池大赛赛题解析(机器学习篇)》,在这本书中,以阿里天池的4个数据竞赛为背景,从赛题理解、数据探索、特征工程、模型验证、特征优化以及模型融合的角度对赛题进行了详细的解答。包括数据竞赛中处理的常用的方法以及这些方法的相关的特点,让我对机器学习的相关方法有了很深刻的印象。在复现书中机器学习算法的过程中,理论不清楚的地方去从“西瓜书”中去找相应的公式的推导。

3.扩展解题思路

这个过程中对机器学习的方法有了新的认识,随后参加了第四届工业大数据创新竞赛的相关比赛,在初赛中最优名次到第28名。拿到了官方的种子选手红包奖励。红包数目虽然不多,也是对我成绩进步的一个肯定,因此也是让我对自己的数据竞赛有了更大的信心!但由于复赛需要写调机报告,对调机报告完全没有任何想法,因此没有完成后续的复赛。

当时参加的比赛

再接再厉!在这个比赛后我又参加了CCF的一个比赛,看到了很多大佬分享他们比赛中的相关的解决方法,这些方法也给了我很多启发,扩展了我的解题思路,让自己对数据竞赛有了更多想法。

学习过程总结

整个学习的过程可以按照下面这个流程来进行:首先是学习入门,了解数据竞赛的流程,知道如何参加数据竞赛,了解数据竞赛的大概方法。对于数据竞赛中常用的方法有所了解,包括数据探索分析、特征工程、特征优化等。

通过学习赛的练手让自己了解数据竞赛的全过程,随后去参加不同的数据竞赛的比赛来改进提高自己的代码能力和分析能力,同时可以学习同一个赛题不同选手的解决方案,从而扩展自己的解题思路。

最后通过分享解题方法,并且不断改进,由输出促进输入,形成良性循环,让自己参加数据竞赛的能力不断提高。

从0入门数据竞赛的方法

4.比赛带给我的

在今年3月,我很幸运地参加了天池一个数据挖掘竞赛的命题,命题者角度看竞赛,收获颇多。从去年一头雾水地在屏幕后跟着鱼佬的直播学习,到今年和鱼佬一起,设计赛题的组队学习课程,还做了自己的直播分享,也不过是一年多的时间。

参加数据竞赛的过程也是提升了自己的代码和解决实际数据问题能力,从数据竞赛中也认识到了自己在模型理解上的不足,完成这些比赛后,我也拿到了自己想要的实习机会。

在数据竞赛的一路学习中,从完全懵逼的小白到数据竞赛的命题设计,Datawhale的小伙伴给了我很多鼓励与支持,也正是这样的鼓励激励着我一步步向前。

最后放一下鱼佬的冠军简历:

下一站,向冠军冲击!

为开源三连

以上是关于下一站,向冠军冲击!的主要内容,如果未能解决你的问题,请参考以下文章

卞宇振一串六!SANDBOX夺冠,EA冠军杯2019冬季赛圆满结束

Python冠军计数器计划

Python 迎来 31 岁生日,蝉联年度编程语言排行榜冠军

hdu 2094 产生冠军

李新海:做到这三点,你就是销售冠军

Python已经31岁了,蝉联年度编程语言排行榜冠军,分享10本超经典Python书籍。