搜索引擎 solr

Posted interfacehwx

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了搜索引擎 solr相关的知识,希望对你有一定的参考价值。

1.创建索引

举例子:

文档一:solr是基于Lucene开发的企业级搜索引擎技术

文档二:Solr是一个独立的企业级搜索应用服务器,Solr是一个高性能,基于Lucene的全文搜索服务器

首先经过分词器分词,solr会为分词后的结果(词典)创建索引,然后将索引和文档id列表对应起来,如下图所示:

技术图片

 

比如:solr在文档1和文档2中都有出现,所以对应的文档ID列表中既包含文档1的ID也包含文档2的ID,文档ID列表对应到具体的文档,并体现该词典在该文档中出现的频次,频次越多说明权重越大,权重越大搜索的结果就会排在前面。

solr内部会对分词的结果做如下处理:

1.去除停词和标点符号,例如英文的this,that等, 中文的"的","一"等没有特殊含义的词

2.会将所有的大写英文字母转换成小写,方便统一创建索引和搜索索引

3.将复数形式转为单数形式,比如students转为student,也是方便统一创建索引和搜索索引

 

 

2.索引搜索过程

知道了创建索引的过程,那么根据索引进行搜索就变得简单了。

1.用户输入搜索条件

2.对搜索条件进行分词处理

3.根据分词的结果查找索引

4.根据索引找到文档ID列表

5.根据文档ID列表找到具体的文档,根据出现的频次等计算权重,最后将文档列表按照权重排序返回

 

参考:https://blog.csdn.net/qq_42809504/article/details/82983984

以上是关于搜索引擎 solr的主要内容,如果未能解决你的问题,请参考以下文章

Solr搜索引擎入门知识汇总

吊炸天企业级搜索引擎-Solr

全文搜索引擎——Solr

全文搜索引擎技术详解之Apache Solr的使用

搜索引擎solr系列---solr分词配置

实战搜索引擎Solr集群和应用