导入 HDFS 数据至 HBase

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了导入 HDFS 数据至 HBase相关的知识,希望对你有一定的参考价值。

参考技术A Time: 2017.9.14

Targets: 对于用户活跃情况的数据

数据格式

执行脚本,Java的Hive脚本。

Hive的Maven Jar包,与Orc包造成冲突,版本不同,导致类不同,一些方法找不到, 参考 。

原因是hive-exec和orc-mapreduce的hive-storage-api版本不同,导致VectorizedRowBatch类异常。

测试:

解决方案,添加hive-storage-api,强制指定使用新的类。

HDFS导入HBase,查看表

表数据

执行数据,从HDFS导入HBase

Processor业务类

注册Processor

执行

使用Log_Analysis分析框架

OK, that's all!

以上是关于导入 HDFS 数据至 HBase的主要内容,如果未能解决你的问题,请参考以下文章

如何通过 hdfs 导入/导出 hbase 数据(hadoop 命令)

HBase结合MapReduce批量导入(HDFS中的数据导入到HBase)

使用 talend 或 sqoop 将数据从 hbase 导入 hdfs

sqoop命令,oracle导入到hdfs、hbase、hive

Sqoop_具体总结 使用Sqoop将HDFS/Hive/HBase与MySQL/Oracle中的数据相互导入导出

使用BulkLoad从HDFS批量导入数据到HBase