Apache Hadoop与Gora的组合功能
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Apache Hadoop与Gora的组合功能相关的知识,希望对你有一定的参考价值。
我有一个简单的Hadoop,Nutch 2.x,Hbase集群。我必须写一份MR工作,找到一些统计数据。这是两步工作,即我认为我也需要合并器功能。在简单的Hadoop工作中,它不是一个大问题,因为很多指南都给出了例如this one。但我找不到任何选择与Gora一起使用合并器。我的统计数据将被添加到Hbase中的页面,这就是为什么我不能关于Gora(我认为)。以下是我希望添加com的代码片段
GoraMapper.initMapperJob(job, query, pageStore, Text.class, WebPage.class,
My_Mapper.class, null, true);
job.setNumReduceTasks(1);
// === Reduce ===
DataStore<String, WebPage> hostStore = StorageUtils.createWebStore(
job.getConfiguration(), String.class, WebPage.class);
GoraReducer.initReducerJob(job, hostStore, My_Reducer.class);
答案
我从来没有和Gora一起使用过这个组合器,但这有用吗(或它显示的是什么错误)?:
GoraReducer.initReducerJob(job, hostStore, My_Reducer.class);
job.setCombinerClass(My_Reducer.class);
编辑:在Apache's Jira about the Combiner创建了一个问题。
以上是关于Apache Hadoop与Gora的组合功能的主要内容,如果未能解决你的问题,请参考以下文章
无法在 Hadoop2 上运行 Nutch2(Nutch 2.x + Hadoop 2.4.0 + HBase 0.94.18 + Gora 0.5 + Avro 1.7.6)