原文链接:https://zhuanlan.zhihu.com/p/25138563
分门别类整理了一些网上的免费数据集,这是分类下载地址,希望能节约大家找数据的时间。欢迎数据达人加入QQ群 565136792 交流。
金融
- 美国劳工部统计局官方发布数据
- 上证A股日线数据,1999.12.09 至 2016.06.08,前复权,1095支股票
- 深证A股日线数据,1999.12.09 至 2016.06.08,前复权,1766支股票
- 深证创业板日线数据,1999.12.09 至 2016.06.08,前复权,510支股票
- MT4平台外汇交易历史数据
- Forex平台外汇交易历史数据
- 几组外汇交易逐笔(Ticks)数据
- 美国股票新闻数据【Kaggle数据】
- 美国医疗保险市场数据【Kaggle数据】
- 美国金融客户投诉数据【Kaggle数据】
- Lending Club 网贷违约数据【Kaggle数据】
- 信用卡欺诈数据【Kaggle 数据】
- 某个金融产品实时交易数据【Kaggle数据】
- 美国股票数据XBRL【Kaggle数据】
- 纽约股票交易所数据【Kaggle数据】
交通
- 2013年纽约出租车行驶数据
- Udacity自动驾驶数据
- 纽约 Uber 接客数据 【Kaggle数据】
- 英国车祸数据(2005-2015)【Kaagle数据】
- 芝加哥汽车超速数据【Kaggle数据】
- KITTI 自动驾驶任务数据【数据太大仅有一部分】
- Cityscapes 场景标注数据【数据太大仅有介绍】
商业
- Amazon 食品评论数据【Kaggle数据】
- Amazon 无锁手机评论数据【Kaggle数据】
- 美国视频游戏销售和评价数据【Kaggle数据】
- Kaggle 各项竞赛情况数据【Kaggle数据】
- Airbnb 开放的民宿信息和住客评论数据
推荐系统
- Netflix 电影评价数据
- MovieLens 20m 电影推荐数据集
- WikiLens
- Jester
- HetRec2011
- Book Crossing
- Large Movie Review
- Retailrocket 商品评论和推荐数据
医疗健康
- 人识别物体时大脑核磁共振影像数据
- 人理解单词时大脑核磁共振影像数据
- 心脏病心房图像及标注数据
- 细胞病理识别
- FIRE 视网膜眼底病变图像数据
- 食物营养成分数据 【Kaggle数据】
- EGG 大脑电波形状数据【Kaggle数据】
- 某人基因序列数据【Kaggle数据】
- 癌症CT影像数据【Kaggle数据】
- 软组织肉瘤CT图像数据【Kaggle数据】
- 美国国家健康与服务部-国家癌症研究所发起的癌症数据仓库介绍【仅有介绍】
- Data Science Bowl 2017 肺癌识别竞赛数据【数据太大仅有介绍】
- TCGA-LUAD 肺癌CT图像数据
- RAID 肺癌CT图像数据
图像数据
综合图像
- Visual Genome 图像数据
- Visual7w 图像数据
- COCO 图像数据
- SUFR 图像数据
- ILSVRC 2014 训练数据(ImageNet的一部分)
- PASCAL Visual Object Classes 2012 图像数据
- PASCAL Visual Object Classes 2011 图像数据
- PASCAL Visual Object Classes 2010 图像数据
- 80 Million Tiny Image 图像数据【数据太大仅有介绍】
- ImageNet【数据太大仅有介绍】
- Google Open Images【数据太大仅有介绍】
场景图像
- Street Scences 图像数据
- Places2 场景图像数据
- UCF Google Street View 图像数据
- SUN 场景图像数据
- The Celebrity in Places 图像数据
Web标签图像
人形轮廓图像
视觉文字识别图像
- Street View House Number 门牌号图像数据
- MNIST 手写数字识别图像数据
- 3D MNIST 数字识别图像数据【Kaggle数据】
- MediaTeam Document 文档影印和内容数据
- Text Recognition 文字图像数据
- NIST Handprinted Forms and Characters 手写英文字符数据
- NIST Structured Forms Reference Set of Binary Images (SFRS) 图像数据
- NIST Structured Forms Reference Set of Binary Images (SFRS) II 图像数据
特定一类事物图像
- 著名的猫图像标注数据
- Caltech-UCSD Birds200 鸟类图像数据
- Stanford Car 汽车图像数据
- Cars 汽车图像数据
- MIT Cars 汽车图像数据
- Stanford Cars 汽车图像数据
- Food-101 美食图像数据
- 17_Category_Flower 图像数据
- 102_Category_Flower 图像数据
- UCI Folio Leaf 图像数据
- Labeled Fishes in the Wild 鱼类图像
- 美国 Yelp 点评网站酒店照片
- CMU-Oxford Sculpture 塑像雕像图像
- Oxford-IIIT Pet 宠物图像数据
- Nature Conservancy Fisheries Monitoring 过度捕捞监控图像数据【Kaggle数据】
材质纹理图像
物体分类图像
- COIL-20 图像数据
- COIL-100 图像数据
- Caltech-101 图像数据
- Caltech-256 图像数据
- CIFAR-10 图像数据
- CIFAR-100 图像数据
- STL-10 图像数据
- LabelMe_12_50k图像数据
- NORB v1.0 图像数据
- NEC Toy Animal 图像数据
- iCubWorld 图像分类数据
- Multi-class 图像分类数据
- GRAZ 图像分类数据
人脸图像
- IMDB-WIKI 500k+ 人脸图像、年龄性别数据
- Labeled Faces in the Wild 人脸数据
- Extended Yale Face Database B 人脸数据
- Bao Face 人脸数据
- DC-IGN 论文人脸数据
- 300 Face in Wild 图像数据
- BioID Face 人脸数据
- CMU Frontal Face Images
- FDDB_Face Detection Data Set and Benchmark
- NIST Mugshot Identification Database
- Faces in the Wild 人脸数据
- CelebA 名人人脸图像数据
- VGG Face 人脸图像数据
- Caltech 10k Web Faces 人脸图像数据
姿势动作图像
- HMDB_a large human motion database
- Human Actions and Scenes Dataset
- Buffy Stickmen V3 人体轮廓识别图像数据
- Human Pose Evaluator 人体轮廓识别图像数据
- Buffy pose 人类姿势图像数据
- VGG Human Pose Estimation 姿势图像标注数据
指纹识别
- NIST FIGS 指纹识别数据
- NIST Supplemental Fingerprint Card Data (SFCD) 指纹识别数据
- NIST Plain and Rolled Images from Paired Fingerprint Cards in 500 pixels per inch 指纹识别数据
- NIST Plain and Rolled Images from Paired Fingerprint Cards 1000 pixels per inch 指纹识别数据
其它图像数据
视频数据
综合视频
人类动作视频
- Microsoft Research Action 人类动作视频数据
- UCF50 Action Recognition 动作识别数据
- UCF101 Action Recognition 动作识别数据
- UT-Interaction 人类动作视频数据
- UCF iPhone 运动中传感器数据
- UCF YouTube 人类动作视频数据
- UCF Sport 人类动作视频数据
- UCF-ARG 人类动作视频数据
- HMDB 人类动作视频
- HOLLYWOOD2 人类行为动作视频数据
- Recognition of human actions 动作视频数据
- Motion Capture 动作捕捉视频数据
- SBU Kinect Interaction 肢体动作视频数据
目标检测视频
- UCSD Pedestrian 行人视频数据
- Caltech Pedestrian 行人视频数据
- ETH 行人视频数据
- INRIA 行人视频数据
- TudBrussels 行人视频数据
- Daimler 行人视频数据
- ALOV++ 物体追踪视频数据
密集人群视频
其它视频
音频数据
综合音频
语音识别
- Sinhala TTS 英语语音识别
- TIMIT 美式英语语音识别数据
- LibriSpeech ASR corpus 语音数据
- Room Impulse Response and Noise 语音数据
- ALFFA 非洲语音数据
- THUYG-20 维吾尔语语音数据
- AMI Corpus 语音识别
自然语言处理
- RCV1英语新闻数据
- 20news 英语新闻数据
- First Quora Release Question Pairs 问答数据
- JRC Names各国语言专有实体名称
- Multi-Domain Sentiment V2.0
- LETOR 信息检索数据
- Yale Youtube Vedio Text
- 斯坦福问答数据【Kaggle数据】
- 美国假新闻数据【Kaggle数据】
- NIPS会议文章信息数据(1987-2016)【Kaggle数据】
- 2016年美国总统选举辩论数据【Kaggle数据】
- WikiLinks 跨文档指代语料
- European Parliament Proceedings Parallel Corpus 机器翻译数据
- WikiText 英语语义词库数据
- WMT 2011 News Crawl 机器翻译数据
- Stanford Sentiment Treebank 词汇数据
社会数据
- 希拉里邮件门泄露邮件
- 波士顿 Airbnb 公开数据【Kaggle数据】
- 世界各国经济发展数据【Kaagle数据】
- 世界大学排名芝加哥犯罪数据(2001-2017)【Kaagle数据】
- 世界范围显著地震数据(1965-2016)【Kaagle数据】
- 美国婴儿姓名数据【Kaagle数据】
- 全世界鲨鱼袭击人类数据【Kaagle数据】
- 1908年以来空难数据【Kaagle数据】
- 2016年美国总统大选数据【Kaagle数据】
- 2013年美国社区统计数据【Kaagle数据】
- 2014年美国社区统计数据【Kaagle数据】
- 2015年美国社区统计数据【Kaagle数据】
- 欧洲足球运动员赛事表现数据【Kaagle数据】
- 美国环境污染数据【Kaagle数据】
- 美国H1-B签证申请数据【Kaggle数据】
- IMDB五千部电影数据【Kaggle数据】
- 2015年航班延误和取消数据【Kaggle数据】
- 凶杀案报告数据【Kaggle数据】
- 人力资源分析数据【Kaggle数据】
- 美国费城犯罪数据【Kaggle数据】
- 安然公司邮件数据【Kaggle数据】
- 历史棒球数据【Kaggle数据】
- 美联航 Twitter 用户评论数据【Kaggle数据】
- 波士顿 Airbnb 公开数据【Kaggle数据】
处理后的科研和竞赛数据