优秀!东大团队“亮剑”数据挖掘领域“世界杯”!
Posted 东南大学
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了优秀!东大团队“亮剑”数据挖掘领域“世界杯”!相关的知识,希望对你有一定的参考价值。
近日,东南大学交通学院刘志远教授团队
博士生刘洋、硕士生吕呈
获得人工智能领域顶级国际会议的
两项竞赛大奖,分别是
KDD CUP Regular Machine
Learning Competition
Track-Task2亚军
以及Task 1第4名
团队成员受邀前往KDD会议现场领奖
并展示获奖方案
相关工作被收录至KDD CUP论文集
ACM SIGKDD Conference on Knowledge Discovery and Data Mining(简称KDD)是国际数据挖掘领域的最高级别的学术会议。其中KDD CUP是ACM SIGKDD组织的年度赛事,有数据挖掘领域“世界杯”之称,是目前数据挖掘领域最高水平、最具影响力、规模最大的国际顶级赛事。本次比赛由百度公司承办,赛题和智能出行相关,吸引了来自世界各地的1600余支队伍参赛。
一个基于百度地图的上下文感知多模式交通推荐服务的
用户界面实例
赛题设置
比赛设置了两个子赛题(Task 1和Task 2),其中,Task 1的题目是“Context-Aware Multi-Modal Transportation Recommendation”,需要参赛者基于提供的用户历史行为数据,在城市的复杂出行情境下比较步行、骑车、打车等各种出行方式,为用户提供个性化和场景化的路线规划服务,帮助用户找到最合适的出行方案。Task 2是应用类问题挑战赛,允许参赛者利用百度开放的大数据自由命题,探索百度大数据在智能城市领域的应用。
另辟蹊径,打破常规
在 Task 1 中,刘志远教授指导的TLab团队设计了一个全新的智能出行多模式推荐架构。为了解决目标函数不一致和样本类别的不平衡问题,提出了一种随机搜索算法,对预测结果进行权重修正,提升最终的预测精度。通过运用一系列打破常规的设计,减少了一半以上人工设计特征的工作量以及算法运行时间。
同时,多模式出行推荐除了可以为百度地图用户提供更好的用户体验外,还有巨大的社会意义,可减少整体出行时间,平衡交通流量,减少交通拥堵,并最终促进智能交通系统的发展。经过三轮残酷的淘汰赛,TLab 团队从1600 余支队伍脱颖而出,在精度(即F1 score)、效率、创新性三个评价指标分别位列第5名、第5名、第1名。经过加权,最终总成绩位居第4名(排名:4 / 1696,奖金 $1,000)。参赛成员:刘洋、吴凡优、张山。这也是获奖队伍中唯一的一支学生队伍。
Task 1 排行榜
独出心裁,推陈出新
Task 2 的竞争更加激烈。在现有的导航软件中,交通模式智能推荐均是基于用户历史行为进行的。TLab团队创新性地将交通工程领域知识与推荐算法深度融合,提出了一套全新的方案,在推荐时不仅考虑用户的个人偏好,也兼顾交通网络容量和出行需求的“供需平衡”,进一步减少用户的总出行成本,提高交通网络的运行效率。
同时,算法还考虑了大数据集下的应用问题。传统的特征提取方法十分耗时,且内存消耗极大,为了在保证精度的条件下,尽可能的缩短运算成本,论文中提出了基于增量多窗口扫描和用户行为层级的特征提取架构。通过将运算资源更多地分配给重要的用户行为,该架构有效地提升了算法整体运行效率。
Task 2 排行榜
增量多窗口扫描(左图)与用户历史行为层级(右图)
经过 KDD CUP 的 9 位 PC member 以及
5 位 senior PC member 的评审
最终 TLab 团队的参赛论文
Interdisciplinary knowledge and experience fusion in multi-modal transportation recommendation system
获得了第2名,奖金 $3,000
东南大学交通学院作为唯一获奖单位
获得了此项国际奖项
这也是所有参赛中国团队在此项任务中
取得的最好成绩
新媒体工作室
往期精选 Editors' Choice
文 | 张航
摄影 | 李勖晟 曹骁勇
编辑 | 孙隽涵
责编 | 吴伊杰
点击“在看”共贺东大佳绩!
以上是关于优秀!东大团队“亮剑”数据挖掘领域“世界杯”!的主要内容,如果未能解决你的问题,请参考以下文章