在HBase之上的solr中创建索引

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在HBase之上的solr中创建索引相关的知识,希望对你有一定的参考价值。

无论如何,我可以在Solr中创建索引,以便从近期实时HBase执行全文搜索。

我不想将整个文本存储在我的solr索引中。制作"stored=false"

注意: - 请记住,我正在处理大型数据集,并希望进行近实时搜索。我们正在谈论TB / PB数据。

更新

Cloudera Distribution:5.4.x与Cloudera Search组件一起使用。

Solr:4.10.x

HBase:1.0.x

Indexer Service:具有cloudera morphlines的Lily HBase Indexer

是否有任何其他NRT Indexer服务或框架可用于代替Cloudera上的Lily。只是一个想法。

答案

Cloudera:请查看this articleHbase-Solr using Cloudera-search,其中介绍了如何实现这一目标。见这些文章所描述的屏幕截图。 Bird view of hbase solr integration Have a look at known issues with Cloudera Search

是的,你可以考虑Morphlines。它们可用于近实时应用程序以及批处理应用程序。

我对hortonworks平台以及如何实现这一点了解不多。

以上是关于在HBase之上的solr中创建索引的主要内容,如果未能解决你的问题,请参考以下文章

如何使用Phoenix在HBase中创建二级索引

在 SolR 中创建搜索索引时出错 - Cassandra 集成 (DSE)

如何使用Phoenix在CDH的HBase中创建二级索引

Hbase+Solr实现二级索引提供高效查询

HBase篇:CDH使用Solr实现HBase二级索引

CDH Solr Hbase二级索引