solr5中文分词bug解决

Posted 茫洋

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了solr5中文分词bug解决相关的知识,希望对你有一定的参考价值。

下载 ik分词包

地址:http://http://pan.baidu.com/s/1c1RcnAw

 

1.修改 pom.xml 

<javac.src.version>1.7</javac.src.version>
<javac.target.version>1.7</javac.target.version>

修改成你使用的版本,保存

解压后在工程目录内 打开命令窗口

输入 mvn -DskipTests clean package   完成后

 

2.部署项目

把生成的jar 放到 solr项目下 /WEB-INF/lib 

然后在 WEB-INF 下新建 calsses 文件夹

src/main/resources 下的 IKAnalyzer.cfg.xml 和 stopword.dic 两个文件发到 新建的 calsses 文件夹内

 

 

3.修改core

修改要修改的core    位置: conf/schema.xml

添加

    <fieldType name="text_ik" class="solr.TextField">   
          <analyzer type="index" useSmart="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>   
          <analyzer type="query" useSmart="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>   
        </fieldType>

然后修改字段的type 例如:

<field name="title" type="text_ik" indexed="true" stored="true" multiValued="true"/>

运行测试:

这是默认的:

 

分词后:

 

 

以上是关于solr5中文分词bug解决的主要内容,如果未能解决你的问题,请参考以下文章

solr.Net课程三 solr5.5 IKAnalyzer分词配置

solr5.5.4整合IK分词器

solr入门之solr5x源码在eclipse中运行及添加mmseg分词器

solr入门之solr5x源码在eclipse中运行及添加mmseg分词器

solr入门之solr5x源码在eclipse中运行及添加mmseg分词器

solr教程