哪里可以找到 Hive 的大数据?

Posted

技术标签:

【中文标题】哪里可以找到 Hive 的大数据?【英文标题】:Where to find large data for hive? 【发布时间】:2016-07-19 03:24:25 【问题描述】:

我想在样本数据上测试 hive。我在哪里可以获得可用于通过 sqoop 在 hive 中导入然后使用 hive 进行分析的数据。数据大小应以 GB 为单位。

【问题讨论】:

【参考方案1】:

Here 你有一个针对数据科学的许多不同的免费可用大数据集的列表。

另外,here 您可以找到大量用于训练的大型公共数据集。

最后,您可以随时尝试使用***'s 数据集。

【讨论】:

在堆栈溢出的调查数据上工作会很有趣。 确实 :-) 我最近发现了它。

以上是关于哪里可以找到 Hive 的大数据?的主要内容,如果未能解决你的问题,请参考以下文章

打怪升级之小白的大数据之旅(七十)<Hive旅程终点站:Hive的综合案例>

打怪升级之小白的大数据之旅(六十二)<Hive旅程第三站:Hive数据类型>

打怪升级之小白的大数据之旅(六十二)<Hive旅程第三站:Hive数据类型>

开发一个不需要重写成Hive QL的大数据SQL引擎

打怪升级之小白的大数据之旅(六十八)<Hive旅程第九站:Hive的压缩与存储>

打怪升级之小白的大数据之旅(六十八)<Hive旅程第九站:Hive的压缩与存储>