Tianchi发布完整开源机器学习数据集!
Posted Python数据科学
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Tianchi发布完整开源机器学习数据集!相关的知识,希望对你有一定的参考价值。
关注上方“Python数据科学”,选择星标,
关键时间,第一时间送达!
来源:Tianchi,方向:开源数据集
近期,Tianchi发布了一份非常全面的开源数据集。包含了计算机视觉,自然语言处理,金融,电商,医疗,工业,农业等数据集,非常适合学习和实践,Datawhale整理如下:
数据集开源地址
https://tianchi.aliyun.com/dataset
电商
淘宝直播商品识别数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=75730
阿里巴巴用户行为数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=81505
面向商品的视频描述生成数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=75986
电商服装产品视频标题数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=75173
速卖通搜索系统数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=74690
淘宝用户行为数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=72423
甜品店铺用户评分数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=4366
智能出行平台车辆订单数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=39384
医疗
脊椎疾病病理数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=79463
医学影像和标题的语篇照应数据集MedICaT
https://tianchi.aliyun.com/dataset/dataDetail?dataId=86602
息肉医学影像数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=84385
中风后病灶解剖追踪数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=82972
颅骨医学图像数据集用于监测颅内出血
https://tianchi.aliyun.com/dataset/dataDetail?dataId=82967
皮肤病图像数据集用于诊断黑素瘤
https://tianchi.aliyun.com/dataset/dataDetail?dataId=82823
COVID-19 mRNA疫苗数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=82790
OSIC肺部CT扫描影像数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=82703
自然神经影像数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=82631
医学影像数据集MedMNIST
https://tianchi.aliyun.com/dataset/dataDetail?dataId=82187
生物医学实体标准化数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=81720
生物医学概念标准化数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=81565
社交媒体医学实体链接语料数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=81554
PubMedQA生物医学研究问答数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=81523
中文BLUE数据集(生物医学文本挖掘语料库)
https://tianchi.aliyun.com/dataset/dataDetail?dataId=81513
中文医学知识图谱数据集CMeKG
https://tianchi.aliyun.com/dataset/dataDetail?dataId=81506
医学对话数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=79671
中文医学问答数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=79670
平安医学技术疾病问答迁移学习数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=79665
临床术语标准化数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=79664
医学实体识别和属性抽取EMR数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=79663
疫情相似句对诊断数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=76751
2019-nCoV新型冠状病毒基因测序数据
https://tianchi.aliyun.com/dataset/dataDetail?dataId=51202
2020新冠肺炎全国各省数据
https://tianchi.aliyun.com/dataset/dataDetail?dataId=78902
IT通讯
阿里巴巴快递送达检测系统Beacon数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=76359
大型硬盘故障预测数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=70251
交通
谷歌地标数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=86611
自然语言处理
语义分割数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=82714
谷歌MC4数据集(可翻译101种语言)
https://tianchi.aliyun.com/dataset/dataDetail?dataId=82412
工业
布匹瑕疵智能识别数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=79336
农业
遥感检测数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=74952
科学
太阳耀斑预测数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=74780
太阳黑子类型智能分类数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=74779
计算机视觉
视盲OCR图片文案顺序理解数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=72926
家装
家居成品房3D图像数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=65347
公共
2012美联邦总统选举数据
https://tianchi.aliyun.com/dataset/dataDetail?dataId=2581
共享单车租用数据
https://tianchi.aliyun.com/dataset/dataDetail?dataId=54174
教育系统学生分班预测
https://tianchi.aliyun.com/dataset/dataDetail?dataId=47307
员工离职预测数据
https://tianchi.aliyun.com/dataset/dataDetail?dataId=25860
娱乐
豆瓣电影评分数据
https://tianchi.aliyun.com/dataset/dataDetail?dataId=9603
金融
银行营销活动效果预测
https://tianchi.aliyun.com/dataset/dataDetail?dataId=45944
信贷用户逾期预测数据
https://tianchi.aliyun.com/dataset/dataDetail?dataId=29157
金融业股票数据
https://tianchi.aliyun.com/dataset/dataDetail?dataId=46522
二手车交易数据集
https://tianchi.aliyun.com/dataset/dataDetail?dataId=62977
我是东哥,最后给大家 分享《100本Python电子书》 ,包括Python编程技巧、数据分析、爬虫、Web开发、机器学习、深度学习。 现在免费分享出来,有需要的读者可以下载学习,在下面的公众号 「GitHuboy」 里回复关键字 : Python ,就行。
推荐阅读
爱点赞的人,运气都不会太差
以上是关于Tianchi发布完整开源机器学习数据集!的主要内容,如果未能解决你的问题,请参考以下文章