Solr4.10.4 加中文分词

Posted ff111

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Solr4.10.4 加中文分词相关的知识,希望对你有一定的参考价值。

 

ik分词插件下载地址:

https://download.csdn.net/download/u014453536/9587721

接上一教程,这个教程如何配置中文ik分词

技术图片

检查schema的管理模式

配置成经典模式

技术图片

 <!-- 经典模式 -->
 <schemaFactory class="solr.ClassicIndexSchemaFactory"/>
  
<!--修改节点 updateRequestProcessorChain-->
<updateRequestProcessorChain name="add-unknown-fields-to-the-schema" default="$update.autoCreateFields:true" processor="uuid,remove-blank,field-name-mutating,parse-boolean,parse-long,parse-double,parse-date">
    <processor class="solr.LogUpdateProcessorFactory"/>
    <processor class="solr.DistributedUpdateProcessorFactory"/>
    <processor class="solr.RunUpdateProcessorFactory"/>
  </updateRequestProcessorChain>

 解压分词工具包,把IKAnalyzer2012FF_u1.jar文件复制到lib目录见图

技术图片

技术图片

 

重命名文件managed-schema为schema.xml

技术图片

技术图片

 

增加ik分词配置

技术图片

 <field name="my_name" type="text_ik" indexed="true" stored="true"/>

技术图片

<fieldType name="text_ik" class="solr.TextField">   
   <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>   
   <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>   
  </fieldType>

 

配置好以后重启tomcat服务

技术图片

 

以上是关于Solr4.10.4 加中文分词的主要内容,如果未能解决你的问题,请参考以下文章

浅谈文本分析分词及关系图

中文分词文章索引和分词数据资源分享

基于词典规则的中文分词

中文分词工具测评

投稿 | 机器如何理解语言—中文分词技术

[Nutch]Solr配置自定义的中文分词器mmseg4j