全文检索工具 Solr 的入门简介

Posted 研发云

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了全文检索工具 Solr 的入门简介相关的知识,希望对你有一定的参考价值。

很多大型网站都需设置站内搜索功能

但传统的数据库查询方式

往往在使用效果上有所局限

无法满足一些高级的搜索需求

而使用第三方引擎系统的话则不方便扩展

这时就需要使用 Solr 这样的检索工具

来实现相应的站内搜索服务

全文检索工具 Solr 的入门简介

Solr 是一个独立的企业级搜索应用服务,它以 Lucene 搜索库为核心,采用采用 Java5 开发,对外提供类似于 Web-service 的API接口。用户可以通过 http 请求,向搜索引擎服务器提交一定格式的 XML 文件,并生成索引;也可以通过 Http Get 操作提出查找请求,并得到 XML 格式的返回结果。


Document 是 Solr 索引(indexing)和搜索的基本单元,字段(Field)则是构成 Document 的基本单元。Solr 提供了丰富的字段类型支持,也允许用户自定义其它合适的类型。

全文检索工具 Solr 的入门简介

Solr 可以独立运行在

Jetty、Tomcat 等 Servlet 容器中

它利用 Zookeeper 进行分布式管理

提供了比 Lucene 更为丰富的查询语言

同时对查询性能进行优化

实现了可配置、可扩展

而且 Solr 还提供了一个完善的功能管理界面

因此它是一款非常优秀的全文搜索引擎

Amazon,Instagram 和 Netflix 等公司

都在使用 Solr


Solr的搜索步骤

全文检索工具 Solr 的入门简介

首先用户需要通过客户端输入查询语句

系统对查询内容进行词、语法分析、语言处理

然后搜索索引,得到符合语法树的文档集合

根据查询语句与文档的相关性

对结果进行排序

最后通过客户端返回查询结果给用户

solrnet 是访问 Solr 服务的.net客户端

solrj 是访问 Solr 服务的java客户端

它们通常被嵌入在业务系统中

通过 Solr 的 API 接口实现操作

全文检索工具 Solr 的入门简介

solr 的优点总结

1、通过 HTTP 协议处理搜索和查询,具备实时和高级全文搜索的能力,并提供功能全面的管理界面。


2、具有高容量、高稳定性和容错性,易监控且易配置。


3、支持添加多种格式的索引,如:html、PDF、微软 Office 系列软件格式以及 JSON、XML、CSV 等纯文本格式,数据被导入到 Solr 的方式也是多种多样。


4、新功能能够以插件的形式非常方便地添加到 Solr 服务器上。


5、有一个庞大、成熟的用户、开发和贡献者社区。

全文检索工具 Solr 的入门简介

长|按|二|维|码|关|注

获取更多产品介绍及业界动态

全文检索工具 Solr 的入门简介研发云微信公众号
移动Labs公众号

 研·发·云


以上是关于全文检索工具 Solr 的入门简介的主要内容,如果未能解决你的问题,请参考以下文章

ElasticSearcho从入门到放弃:简介, lucene,概念, 安装

ElasticSearcho从入门到放弃:简介, lucene,概念, 安装

solr:简介与配置

lucene入门&Solr

Solr实践|Solr常用检索查询业务Demo

Solr简介和使用(一期)