HBase篇:CDH使用Solr实现HBase二级索引

Posted Hbase工作笔记

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HBase篇:CDH使用Solr实现HBase二级索引相关的知识,希望对你有一定的参考价值。

前言:


        详细步骤请参看“阅读原文”,下面通过图文帮大家理解一下。


1.简单说明


使用Solr构建Hbase二级索引的原理很简单,不过是以空间换取时间,对指定列在Solr中构建索引,最终还是通过rowkey访问Hbase,如下图:



2.四大组件


Hbase+Zookeeper+Solr+Key Value Store(Lily Hbase Indexer)


HBase篇:CDH使用Solr实现HBase二级索引

可见,Hbase与Solr是独立部署的,而让两者发生关系的最核心组件就是Key Value Store.


HBase篇:CDH使用Solr实现HBase二级索引


当然,我们可以不使用现成的K-V Store自己代码实现,大概逻辑也就是:从Hbase中拉取数据然后发起POST请求存到Solr中,Hbase中一行或多行数据对应Solr中一个或多个doc,如图:


HBase篇:CDH使用Solr实现HBase二级索引


3.三个重要的配置文件


schema.xml:对应组件Solr,构建Solr schema,定义了Hbase要构建索引的列,如图:


HBase篇:CDH使用Solr实现HBase二级索引

morphline-hbase-mapper.xml:让Hbase与Lily发生关系,如图:


HBase篇:CDH使用Solr实现HBase二级索引

morphlines.conf:Hbase与Solr映射关系在此文件中体现,如图:


HBase篇:CDH使用Solr实现HBase二级索引

三个文件的关系图如下,通过这三个文件Hbase,Solr 及 Lyli 也就一一映射起来了,如图:

HBase篇:CDH使用Solr实现HBase二级索引


4.理解Solr


见逻辑视图:


HBase篇:CDH使用Solr实现HBase二级索引

索引对照图:

HBase篇:CDH使用Solr实现HBase二级索引

物理视图与逻辑视图与索引视图:


HBase篇:CDH使用Solr实现HBase二级索引

创建索引过程:Solr提供restful接口

HBase篇:CDH使用Solr实现HBase二级索引


5.了解Hbase结构图


HBase篇:CDH使用Solr实现HBase二级索引

6.了解Lily如何做桥梁


基于Hbase复制功能:


HBase篇:CDH使用Solr实现HBase二级索引


具体执行流程:主类SepConsumer,多线程并发处理

HBase篇:CDH使用Solr实现HBase二级索引


其实就是这么个过程:


详细介绍请阅读原文!







将最好的祝福送给正在阅读的你,感恩!

以上是关于HBase篇:CDH使用Solr实现HBase二级索引的主要内容,如果未能解决你的问题,请参考以下文章

Hbase+Solr实现二级索引提供高效查询

使用HBase Indexer建立二级索引(整合最新版本的HBase1.2.6及Solr 7.2.1)

使用HBase Indexer建立二级索引(整合最新版本的HBase1.2.6及Solr 7.2.1)

HBase实操 | 使用Phoenix在CDH的HBase创建二级索引

HBase协处理器同步二级索引到Solr

如何使用Phoenix在CDH的HBase中创建二级索引