如何将数据从mongodb导入hive
Posted
技术标签:
【中文标题】如何将数据从mongodb导入hive【英文标题】:how to import data from mongodb to hive 【发布时间】:2015-11-17 04:51:10 【问题描述】:我想知道如何在 mapreduce 程序的帮助下将数据从 Mongodb 导入 hive。以前我是在 mapreduce 程序的帮助下将数据从 mongodb 导入到 hdfs,现在我想直接从 mongodb 导入数据到 hive。 如果有人能够为此分享任何参考文件,我真的很感激。 提前致谢。
【问题讨论】:
请尽量详细一点。到目前为止,您尝试过什么? 【参考方案1】:你可以试试Mongo-Hadoop connector。它允许您使用 Mongo 作为 Hive 的后端存储(您可以使用 Hive 查询存储在 MongoDB 中的数据)。
如果您确实需要将数据导入 Hive,您首先需要创建一个(临时)Hive 表,其中包含 mongo 集合,您将从该表中导入数据作为后端。然后,您可以使用 Hive CTAS 查询将数据导入另一个 Hive 表。
【讨论】:
以上是关于如何将数据从mongodb导入hive的主要内容,如果未能解决你的问题,请参考以下文章
如何像调度程序一样将大数据从 MongoDB 导入 SQL Server