如何将数据从mongodb导入hive

Posted

技术标签:

【中文标题】如何将数据从mongodb导入hive【英文标题】:how to import data from mongodb to hive 【发布时间】:2015-11-17 04:51:10 【问题描述】:

我想知道如何在 mapreduce 程序的帮助下将数据从 Mongodb 导入 hive。以前我是在 mapreduce 程序的帮助下将数据从 mongodb 导入到 hdfs,现在我想直接从 mongodb 导入数据到 hive。 如果有人能够为此分享任何参考文件,我真的很感激。 提前致谢。

【问题讨论】:

请尽量详细一点。到目前为止,您尝试过什么? 【参考方案1】:

你可以试试Mongo-Hadoop connector。它允许您使用 Mongo 作为 Hive 的后端存储(您可以使用 Hive 查询存储在 MongoDB 中的数据)。

如果您确实需要将数据导入 Hive,您首先需要创建一个(临时)Hive 表,其中包含 mongo 集合,您将从该表中导入数据作为后端。然后,您可以使用 Hive CTAS 查询将数据导入另一个 Hive 表。

【讨论】:

以上是关于如何将数据从mongodb导入hive的主要内容,如果未能解决你的问题,请参考以下文章

如何将数据从 mongodb 导入到 pandas?

如何像调度程序一样将大数据从 MongoDB 导入 SQL Server

如何使用mongo-connector将数据从mongodb导入到apache solr

如何将转储文件夹导入 mongodb 数据库?

1200万 mysql数据怎么快速导入到Mongodb

将数据从 SQL 导入 MongoDB。全有或全无