Kaggle 新赛 | GoDaddy 微型企业密度预测
Posted 叶庭云
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Kaggle 新赛 | GoDaddy 微型企业密度预测相关的知识,希望对你有一定的参考价值。
文章目录
一、比赛背景和目标
1. 背景
美国政策领导人努力发展更具包容性和抗衰退能力的经济体。他们也意识到,随着科技的进步,创业从来没有像今天这样容易。无论是创造一个更合适的工作/生活平衡,追随激情,还是由于失业,研究表明,越来越多的美国人选择创建自己的企业来实现他们的财务目标。挑战在于,这些 “微型企业” 往往规模太小或太新,无法在传统经济数据源中显示出来,因此决策者几乎不可能研究它们。但是,数据科学可以帮助填补这些空白,并提供与这些业务相关的因素的洞察力。
目前的模型利用现有的内部和人口普查数据,使用计量经济学方法,并侧重于理解主要决定因素。虽然这些方法是足够的,但是有可能包括更多的数据和使用更先进的方法来改进预测和更好地为决策提供信息。
竞赛主办方 GoDaddy 是全球最大的面向企业家的服务平台。他们的使命是通过提供在线发展所需的所有帮助和工具,增强他们在全球范围内拥有 2000 多万客户的社区(以及世界各地的企业家)的能力。你们的工作将有助于决策者更好地了解情况,因为他们正在努力为微型企业家创造一个更美好的世界。这将对全国各地的社区产生真正和实质性的影响,并将帮助我们更广泛的经济适应不断变化的世界。
2. 比赛目标
本次比赛的目标是预测特定地区的每月微型企业密度。你将开发一个在美国县级数据上训练的精确模型。你们的工作将帮助政策制定者了解微型企业,这是一个非常小的实体的增长趋势。额外的信息将使新的政策和方案能够改善这些最小的企业的成功和影响。
二、提交、时间线和奖项
评测指标用真实值和预测值之间的 sMAPE。当真实值和预测值都为 0 时,定义 sMAPE = 0。
Submission File:
- 对于每个 row _ id,你必须预测微型企业密度。
- 文件应该包含一个头部并且有以下格式
row_id,microbusiness_density
1001_2022-11-01,1.2
1002_2022-11-01,2.3
1003_2022-11-01,3.4
......
整个比赛提交文件将保持不变。但是,积极评分的日期将随着新数据的出现而更新。在比赛的积极阶段,只有最近一个月的数据将用于公共排行榜。在比赛的积极阶段,只有最近一个月的数据将用于公共排行榜。
时间线:
- 开始日期:2022 年 12 月 15 日;
- 报名截止日期:2023 年 3 月 7 日。你必须在截止日期前接受比赛规则,才能参加比赛;
- 团队合并最后期限:2023 年 3 月 7 日。这是参与者可以加入或合并团队的最后一天;
- 正式提交截止日期:2023 年 3 月 14 日
请注意: 您的 notebooks 将用于预测未来的数据(不包括在训练集和测试集里的未见数据)
除非另有说明,所有截止日期均为 UTC 时间下午 11:59。比赛组织者保留更新比赛时间表的权利,如果他们认为有必要的话。
Prizes:
- 冠军:$20000
- 亚军:$15000
- 季军:$10000
- 四等奖:$5000
- 第五名:$5000
- 六等奖:$5000
三、代码要求
这是一个代码竞赛,参赛作品必须通过 Notebooks 提交。为了在提交后使 “Submit” 按钮处于活动状态,必须满足以下条件:
- CPU Notebooks <= 9 小时运行时间;
- GPU Notebooks <= 9 小时运行时间;
- 禁止网上可获取;
- 允许免费和公开的外部数据,包括预先训练的模型;
- 提交文件必须命名为 submission.csv。
有关如何提交的详细信息,请参阅代码竞赛常见问题解答。如果遇到提交错误,请查看代码调试文档。
以上是关于Kaggle 新赛 | GoDaddy 微型企业密度预测的主要内容,如果未能解决你的问题,请参考以下文章