Solr的安装以及中文分析器的配置

Posted 2020-11-23 hanpi

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Solr的安装以及中文分析器的配置相关的知识，希望对你有一定的参考价值。

一丶Solr简介　

　　Apache Solr是一个流行的开源搜索服务器，它通过使用类似REST的HTTP API，这就确保你能从几乎任何编程语言来使用solr。Solr是一个开源搜索平台，用于构建搜索应用程序。它建立在Lucene(全文搜索引擎)之上。 Solr是企业级的，快速的和高度可扩展的。使用Solr构建的应用程序非常复杂，可提供高性能。支持并行SQL查询的执行.Solr可以和Hadoop一起使用。由于Hadoop处理大量数据，Solr帮助我们从这么大的源中找到所需的信息。不仅限于搜索，Solr也可以用于存储目的。像其他NoSQL数据库一样，它是一种非关系数据存储和处理技术。

总之，Solr是一个可扩展的，可部署，搜索/存储引擎，优化搜索大量以文本为中心的数据。

二丶Solr的安装

1：安装 Tomcat，解压缩即可。

2：解压 solr。

3：把 solr 下的dist目录solr-4.10.3.war部署到 Tomcatwebapps下(去掉版本号)。

4：启动 Tomcat解压缩 war 包

5：把solr下example/lib/ext 目录下的所有的 jar 包，添加到 solr 的工程中(WEB-INFlib目录下)。

6：创建一个 solrhome 。solr 下的/example/solr 目录就是一个 solrhome。复制此目录到D盘改名为solrhome

7：关联 solr 及 solrhome。需要修改 solr 工程的 web.xml 文件。

<env-entry>

<env-entry-name>solr/home</env-entry-name>

<env-entry-value>d:solrhome</env-entry-value>

<env-entry-type>java.lang.String</env-entry-type>

</env-entry>

8：启动 Tomcat

http://IP:8080/solr/

三丶配置中文分析器(中文分词,以便用来进行分词查询)

　　1 IK Analyzer简介

IK Analyzer 是一个开源的，基亍 java 语言开发的轻量级的中文分词工具包。从 2006年 12 月推出 1.0 版开始， IKAnalyzer 已经推出了 4 个大版本。最初，它是以开源项目Luence 为应用主体的，结合词典分词和文法分析算法的中文分词组件。从 3.0 版本开始，IK 发展为面向 Java 的公用分词组件，独立亍 Lucene 项目，同时提供了对 Lucene 的默认优化实现。在 2012 版本中，IK 实现了简单的分词歧义排除算法，标志着 IK 分词器从单纯的词典分词向模拟语义分词衍化。

　　2 IK Analyzer配置　　　

1、把IKAnalyzer2012FF_u1.jar 添加到 solr 工程的 lib 目录下

2、创建WEB-INF/classes文件夹把扩展词典、停用词词典、配置文件放到 solr 工程的 WEB-INF/classes 目录下。

3、修改 Solrhome 的 schema.xml 文件，配置一个 FieldType，使用 IKAnalyzer,这样才能在查询的时候使用中分分词(分词解析)

<fieldType name="text_ik" class="solr.TextField">

<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>

</fieldType>

四丶配置域

域相当于数据库的表字段，用户存放数据，因此用户根据业务需要去定义相关的Field（域），一般来说，每一种对应着一种数据，用户对同一种数据进行相同的操作。

　　　　域的常用属性：

- - - name：指定域的名称
    - 　　　　type：指定域的类型
    - 　　　　indexed：是否索引
    - 　　　　stored：是否存储
    - 　　　　required：是否必须
    - 　　　　multiValued：是否多值

　　　　2.举例子定义域　　　　

　　　　　　　　修改solrhome的schema.xml 文件设置业务系统 Field

<field name="item_goodsid" type="long" indexed="true" stored="true"/>

　　　　2.复制域

　　　　　　　　复制域的作用在于将某一个Field中的数据复制到另一个域中,可用于多条件查询

<copyField source="item_title" dest="item_keywords"/>

　　　　3.动态域

　　　　　　当我们需要动态扩充字段时，我们需要使用动态域。对于品优购，规格的值是不确定的，所以我们需要使用动态域来实现。需要实现的效果如下：

　　　　　　配置：

<dynamicField name="item_spec_*" type="string" indexed="true" stored="true" />

以上是关于Solr的安装以及中文分析器的配置的主要内容，如果未能解决你的问题，请参考以下文章