使用 talend 或 sqoop 将数据从 hbase 导入 hdfs

Posted

技术标签:

【中文标题】使用 talend 或 sqoop 将数据从 hbase 导入 hdfs【英文标题】:import data from hbase to hdfs using talend or sqoop 【发布时间】:2017-01-16 12:05:55 【问题描述】:

是否可以使用 Talend 或 sqoop 将数据从 hbase 导出到 hdfs?如果它不是直接可用的,那么实现这种用例的最佳实践是哪种解决方法

【问题讨论】:

【参考方案1】:

是的,你可以使用 talend。

在 talend 的大数据版本中,您有 hdfs 组件和 hbase 组件。 你需要把 tHbaseinput -> tmap -> tHDFSOutput.

【讨论】:

【参考方案2】:

是的,有可能!

使用@Théo 回答的 Talend,但不使用 Sqoop,因为它的 Sql to Hadoop 不是 Inter-Hadoop 解决方案,可能有解决方法使用 Sqoop 来实现,但这不是理想的用例。

但实际上,HBase 将其数据存储在 HDFS 中。如果您想将它们导出为文件或使用 Hive 查询它们,您可以创建一个读取 HBase 数据的 Hive 表,请参阅this。

【讨论】:

以上是关于使用 talend 或 sqoop 将数据从 hbase 导入 hdfs的主要内容,如果未能解决你的问题,请参考以下文章

Talend 日期格式错误

使用 talend 将数据从 as400 加载到雪花时数据发生变化

使用 MapReduce 或 Sqoop 将数据加载到 Greenplum DB

使用 talend 将 CSV 文件红移

我用sqoop从oracle导入数据到hdfs时,总是报 表或视图不存在错误,求解答...

通过 talend 从 oracle 加载到 greenplum 时的数据不能很好地处理 CLOB 列