Quick start Solr 之solr仓库和IK分词

Posted ibelieving

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Quick start Solr 之solr仓库和IK分词相关的知识,希望对你有一定的参考价值。

添加solr仓库

1. 在solrhome下创建collection1目录
[[email protected] solrhome]# mkdir collection1
2. 复制server/solr/configsets/_default/conf/ 到 solr-home/collection1 /下
[[email protected] solrhome]# cp -r ../solr-7.3.1/server/solr/configsets/_default/conf/ collection1/
3. 在solr应用界面添加core

技术分享图片

  • 第一个 输入框是Core的名字,任取即可, 这里我就用collection1
  • 第二个输入框是Core的目录           这里我就用collection1
  • 第三个输入框是data的目录,创建后就可以在collection1下面看到该文件夹(默认即可)
  • 第四个输入框是solr的配置信息的目录,里面各种配置信息,默认不要修改(默认即可)
  •  
  • 第五个输入框是保存数据的配置xml,添加后在collection1/conf目录下的managed-schema文件 (默认即可)

技术分享图片

4.添加core后logging日志会有些报错如下:

技术分享图片

这是因为需要引用的包目录没有找到

拷贝安装包下dist目录和contrib目录到solrhome下面

cp -r solr-7.3.1/dist/ ../solrhome

cp -r solr-7.3.1/contrib/ ../solrhome

修改仓库中 collection1/conf/solrConfig 配置文件

技术分享图片

重新启动就没有错了

IK分词器
5. 安装IK分词器
IK 分词器需要使用 Ik 分词器 jar 文件:
拷贝 Ik 分词器 jar 包到 tomcat-solr/webapps/solr/WEB-INF/lib
下载链接https://pan.baidu.com/s/11QyMbW5N4L59vGsjMc0t6g
6. 导入配置文件
需要 Ik 分词器配置文件:核心配置文件: ikAnalyzer.cfg.xml,ext.dic,stopword.dic
ikAnalyzer.cfg.xml 加载 ext.dic,stopword.dic
ext.dic,stopword.dic 无 BOM 的 UTF-8 格式
注意:把上面 3 个文件导入 tomcat-solr/webapps/solr/WEB-INF/classes

技术分享图片

技术分享图片

新增一个文件:IKAnalyzer.cfg.xml ,与classes文件同级,另在classes文件下新建ext.dic和stoword.dic,不会新建dic的可以用文本另存为的方式存储为dic文件。

IKAnalyzer.cfg.xml 文件即配置ext.dic和stopword.dic两个字典库的位置。具体配置如下:

<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"> 

<properties> 

<comment>IK Analyzer 扩展配置</comment>

<!--用户可以在这里配置自己的扩展字典,多个以分号隔开 -->

<entry key="ext_dict">ext.dic;</entry>

<!--用户可以在这里配置自己的扩展停止词字典,多个以分号隔开-->

<entry key="ext_stopwords">stopword.dic;</entry>

</properties>

??ext.dic即扩展词库的存储文件,比如我打算建立一个词“清池街办新庄村”这样一个词,那打开该文件,在里边新添一个即可:清池街办新庄村,  注意: 文件格式必需是:无BOM的UTF-8格式

添加的每个词都自己占一行就可以的。 
??stopword.dic停止词字典的配置,你可以将空格什么的填进去,这里不用这个字典配置。

  1. 修改solr仓库collection1/conf/managed-schem配置文件

在配置文件:managed-schem 配置文件定义:域类型: FieldType,域类型定义使用何种分词

<fieldType name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

  1. 配置业务域

   <field name="query" type="text_ik" indexed="true" stored="true"/>

       分词测试:

技术分享图片

 

 

 

 

















以上是关于Quick start Solr 之solr仓库和IK分词的主要内容,如果未能解决你的问题,请参考以下文章

5.solr学习速成之语法

Solr官方文档翻译-About & Getting Started

Solr学习记录:Getting started

Windows下启动Solr报错:Nothing to start,exiting...

solr搜索之demo和集成IKAnalyzer

优雅地终止从带有“start /b”的 Windows 批处理文件启动的 java (jetty/solr) 进程