Hive 教程的示例数据
Posted
技术标签:
【中文标题】Hive 教程的示例数据【英文标题】:Example data for Hive tutorial 【发布时间】:2016-11-22 09:01:07 【问题描述】:在线提供的原始 Hive 教程引用了一个名为“pv_2008-06-08.txt”的数据集:
https://cwiki.apache.org/confluence/display/Hive/Tutorial
当然,它在 Internet 上的数十个教程中都有引用。但是,我无法在任何地方找到原始数据。有人知道它在哪里吗?
【问题讨论】:
quora.com/Where-can-I-find-large-datasets-open-to-the-public通过这个链接 很抱歉,但我不确定您的评论是否回答了我的问题。要么你明白我正在寻找一个通用的样本数据集(我不是:我正在寻找引用的网页浏览量),要么我可以在你给我的链接列表中找到它,但我看不到它。能不能说的详细一点? 【参考方案1】:阅读给定站点后,发现该站点中给出的示例已过时。请使用新链接获取更多示例。
https://cwiki.apache.org/confluence/display/Hive/Tutorial#Tutorial-UsageandExamples
注意:以下许多示例已过时。更多最新信息可以在语言手册中找到。
如果你仍然对那个数据集感兴趣,建议你邮寄到社区提供(请参考下面的链接)
http://hive.apache.org/mailing_lists.html
Hortonworks 数据集:
最近我遇到了这个 Hortonworks 数据集,可用于在 Hive 和 Pig 中创建数据库和查询。
https://app.box.com/v/hadoopcrashcoursedata
如果你想尝试使用这个数据集,这里是使用上述数据集创建表的链接
http://hortonworks.com/hadoop-tutorial/hello-world-an-introduction-to-hadoop-hcatalog-hive-and-pig/#section_4
【讨论】:
感谢 Habi 的链接,但遗憾的是我请求的数据集不存在。以上是关于Hive 教程的示例数据的主要内容,如果未能解决你的问题,请参考以下文章