全文检索工具 Solr 的入门简介
Posted 研发云
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了全文检索工具 Solr 的入门简介相关的知识,希望对你有一定的参考价值。
很多大型网站都需设置站内搜索功能
但传统的数据库查询方式
往往在使用效果上有所局限
无法满足一些高级的搜索需求
而使用第三方引擎系统的话则不方便扩展
这时就需要使用 Solr 这样的检索工具
来实现相应的站内搜索服务
Solr 是一个独立的企业级搜索应用服务,它以 Lucene 搜索库为核心,采用采用 Java5 开发,对外提供类似于 Web-service 的API接口。用户可以通过 http 请求,向搜索引擎服务器提交一定格式的 XML 文件,并生成索引;也可以通过 Http Get 操作提出查找请求,并得到 XML 格式的返回结果。
Document 是 Solr 索引(indexing)和搜索的基本单元,字段(Field)则是构成 Document 的基本单元。Solr 提供了丰富的字段类型支持,也允许用户自定义其它合适的类型。
Solr 可以独立运行在
Jetty、Tomcat 等 Servlet 容器中
它利用 Zookeeper 进行分布式管理
提供了比 Lucene 更为丰富的查询语言
同时对查询性能进行优化
实现了可配置、可扩展
而且 Solr 还提供了一个完善的功能管理界面
因此它是一款非常优秀的全文搜索引擎
Amazon,Instagram 和 Netflix 等公司
都在使用 Solr
Solr的搜索步骤
首先用户需要通过客户端输入查询语句
系统对查询内容进行词、语法分析、语言处理
然后搜索索引,得到符合语法树的文档集合
根据查询语句与文档的相关性
对结果进行排序
最后通过客户端返回查询结果给用户
solrnet 是访问 Solr 服务的.net客户端
solrj 是访问 Solr 服务的java客户端
它们通常被嵌入在业务系统中
通过 Solr 的 API 接口实现操作
solr 的优点总结
1、通过 HTTP 协议处理搜索和查询,具备实时和高级全文搜索的能力,并提供功能全面的管理界面。
2、具有高容量、高稳定性和容错性,易监控且易配置。
3、支持添加多种格式的索引,如:html、PDF、微软 Office 系列软件格式以及 JSON、XML、CSV 等纯文本格式,数据被导入到 Solr 的方式也是多种多样。
4、新功能能够以插件的形式非常方便地添加到 Solr 服务器上。
5、有一个庞大、成熟的用户、开发和贡献者社区。
长|按|二|维|码|关|注
获取更多产品介绍及业界动态
研·发·云
以上是关于全文检索工具 Solr 的入门简介的主要内容,如果未能解决你的问题,请参考以下文章
ElasticSearcho从入门到放弃:简介, lucene,概念, 安装