mapreduce、hbase 和扫描

Posted

技术标签:

【中文标题】mapreduce、hbase 和扫描【英文标题】:mapreduce, hbase and scan 【发布时间】:2017-07-18 00:13:05 【问题描述】:

我有一个扩展 TableMapper 类的 MapReduce 作业。我使用 TableMapperReduceUtil initTableMapperJob 来设置工作正常的初始扫描。根据从 Scan 中检索到的 rowkey,我想在我的 MapReduce Map 方法中的同一张表上运行 Get(使用作为初始 Scan 行中的值的 rowkey)。如何从 Map 方法中访问 Hbase 连接到同一个表?

【问题讨论】:

【参考方案1】:

或许您可以通过这种方式创建新连接:

Configuration config = context.getConfiguration();
Connection conn = ConnectionFactory.createConnection(config);

但我认为在你的情况下使用Spark on HBase 会更容易

【讨论】:

以上是关于mapreduce、hbase 和扫描的主要内容,如果未能解决你的问题,请参考以下文章

通过 shell 命令和 mapreduce 扫描 HBase 会给出两种不同的结果

HBase mapreduce 作业 - 多次扫描 - 如何设置每次扫描的表

Hbase mapreduce 交互

如何将 HBase 的扫描限制在 MapReduce 作业的相关(未过滤)区域

针对不同映射器的 HBase MapReduce 拆分扫描

使用 HBase 表作为 MapReduce 源