Hive 教程的示例数据

Posted

技术标签:

【中文标题】Hive 教程的示例数据【英文标题】:Example data for Hive tutorial 【发布时间】:2016-11-22 09:01:07 【问题描述】:

在线提供的原始 Hive 教程引用了一个名为“pv_2008-06-08.txt”的数据集:

https://cwiki.apache.org/confluence/display/Hive/Tutorial

当然,它在 Internet 上的数十个教程中都有引用。但是,我无法在任何地方找到原始数据。有人知道它在哪里吗?

【问题讨论】:

quora.com/Where-can-I-find-large-datasets-open-to-the-public通过这个链接 很抱歉,但我不确定您的评论是否回答了我的问题。要么你明白我正在寻找一个通用的样本数据集(我不是:我正在寻找引用的网页浏览量),要么我可以在你给我的链接列表中找到它,但我看不到它。能不能说的详细一点? 【参考方案1】:

阅读给定站点后,发现该站点中给出的示例已过时。请使用新链接获取更多示例。

https://cwiki.apache.org/confluence/display/Hive/Tutorial#Tutorial-UsageandExamples

注意:以下许多示例已过时。更多最新信息可以在语言手册中找到。

如果你仍然对那个数据集感兴趣,建议你邮寄到社区提供(请参考下面的链接)

http://hive.apache.org/mailing_lists.html

Hortonworks 数据集:

最近我遇到了这个 Hortonworks 数据集,可用于在 Hive 和 Pig 中创建数据库和查询。

https://app.box.com/v/hadoopcrashcoursedata

如果你想尝试使用这个数据集,这里是使用上述数据集创建表的链接

http://hortonworks.com/hadoop-tutorial/hello-world-an-introduction-to-hadoop-hcatalog-hive-and-pig/#section_4

【讨论】:

感谢 Habi 的链接,但遗憾的是我请求的数据集不存在。

以上是关于Hive 教程的示例数据的主要内容,如果未能解决你的问题,请参考以下文章

我需要一个 Hive 示例项目进行练习。如何处理大型数据库表?我们如何在 Hive 中实际实现查询? [关闭]

Hive多分隔符支持示例

Hive多分隔符支持示例

0010-Hive多分隔符支持示例

大数据之hive:行列转换系列总结

HIVE_SQL转SparkSQL 简单示例