Quick start Solr 之solr仓库和IK分词
Posted ibelieving
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Quick start Solr 之solr仓库和IK分词相关的知识,希望对你有一定的参考价值。
添加solr仓库
1. 在solrhome下创建collection1目录
[[email protected] solrhome]# mkdir collection1
2. 复制server/solr/configsets/_default/conf/ 到 solr-home/collection1 /下
[[email protected] solrhome]# cp -r ../solr-7.3.1/server/solr/configsets/_default/conf/ collection1/
3. 在solr应用界面添加core
- 第一个 输入框是Core的名字,任取即可, 这里我就用collection1
- 第二个输入框是Core的目录 这里我就用collection1
- 第三个输入框是data的目录,创建后就可以在collection1下面看到该文件夹(默认即可)
- 第四个输入框是solr的配置信息的目录,里面各种配置信息,默认不要修改(默认即可)
- 第五个输入框是保存数据的配置xml,添加后在collection1/conf目录下的managed-schema文件 (默认即可)
4.添加core后logging日志会有些报错如下:
这是因为需要引用的包目录没有找到
拷贝安装包下dist目录和contrib目录到solrhome下面
cp -r solr-7.3.1/dist/ ../solrhome
cp -r solr-7.3.1/contrib/ ../solrhome
修改仓库中 collection1/conf/solrConfig 配置文件
重新启动就没有错了
IK分词器
5. 安装IK分词器
IK 分词器需要使用 Ik 分词器 jar 文件:
拷贝 Ik 分词器 jar 包到 tomcat-solr/webapps/solr/WEB-INF/lib
下载链接https://pan.baidu.com/s/11QyMbW5N4L59vGsjMc0t6g
6. 导入配置文件
需要 Ik 分词器配置文件:核心配置文件: ikAnalyzer.cfg.xml,ext.dic,stopword.dic
ikAnalyzer.cfg.xml 加载 ext.dic,stopword.dic
ext.dic,stopword.dic 无 BOM 的 UTF-8 格式
注意:把上面 3 个文件导入 tomcat-solr/webapps/solr/WEB-INF/classes
新增一个文件:IKAnalyzer.cfg.xml ,与classes文件同级,另在classes文件下新建ext.dic和stoword.dic,不会新建dic的可以用文本另存为的方式存储为dic文件。
IKAnalyzer.cfg.xml 文件即配置ext.dic和stopword.dic两个字典库的位置。具体配置如下:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典,多个以分号隔开 -->
<entry key="ext_dict">ext.dic;</entry>
<!--用户可以在这里配置自己的扩展停止词字典,多个以分号隔开-->
<entry key="ext_stopwords">stopword.dic;</entry>
</properties>
??ext.dic即扩展词库的存储文件,比如我打算建立一个词“清池街办新庄村”这样一个词,那打开该文件,在里边新添一个即可:清池街办新庄村, 注意: 文件格式必需是:无BOM的UTF-8格式
添加的每个词都自己占一行就可以的。
??stopword.dic停止词字典的配置,你可以将空格什么的填进去,这里不用这个字典配置。
- 修改solr仓库collection1/conf/managed-schem配置文件
在配置文件:managed-schem 配置文件定义:域类型: FieldType,域类型定义使用何种分词
<fieldType
name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
- 配置业务域
<field name="query" type="text_ik" indexed="true" stored="true"/>
分词测试:
以上是关于Quick start Solr 之solr仓库和IK分词的主要内容,如果未能解决你的问题,请参考以下文章
Solr官方文档翻译-About & Getting Started