如何在solr中添加ik分词器

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何在solr中添加ik分词器相关的知识,希望对你有一定的参考价值。

 分词技术是搜索技术里面的一块基石。很多人用过,如果你只是为了简单快速地搭一个搜索引擎,你确实不用了解太深。但一旦涉及效果问题,分词器上就可以做很多文章。例如, 在我们实际用作电商领域的搜索的工作中,类目预判的实现就极须依赖分词,至少需要做到可以对分词器动态加规则。再一个简单的例子,如果你的优化方法就是对不同的词分权重,提高一些重点词的权重的话,你就需要依赖并理解分词器。

   下面将介绍如何在solr中为core:simple的title添加分词,承接上一篇博文(http://simplelife.blog.51cto.com/9954761/1864073 ),

启动tomcat,浏览器中访问:localhost:8080/solr


技术分享如图,点击collection1中的Analysis,在Field Value (Index)中输入:我爱北京天安门,并选择Analyse Fieldname / FieldType为:title

技术分享

我们知道,我是没有对默认的core:collection1的title做分词的,所以当我输入一句话时并不会被分词。

下面我就为自定义这个core:simple的标题做分词,看看做完分词之后搜索的效果是什么……敬请期待!

========================================================================================

1、下载ik分词器的jar包:http://pan.baidu.com/s/1eScBIJC 

2、将下载下来的jar包复制到apache-tomcat-7.0.72\webapps\solr\WEB-INF\lib中

3、在solrhome\simple\conf下的schema.xml文件中添加fieldType:

<fieldType name="text_ik" class="solr.TextField">   
     <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>   
</fieldType>

然后将field中name="title"的type修改成text_ik,如下图:

技术分享

4、重启tomcat,浏览器中访问:localhost:8080/solr, 选择simple-->Analysis,重新上面的操作看效果:

技术分享

如果做到这,那么恭喜你,完成了solr中ik分词器的使用。

本文出自 “Simple Life” 博客,请务必保留此出处http://simplelife.blog.51cto.com/9954761/1864080

以上是关于如何在solr中添加ik分词器的主要内容,如果未能解决你的问题,请参考以下文章

solr添加分词器ik-analyzer-solr

solr添加中文IK分词器,以及配置自定义词库

solr ik分词怎样取消英文字母和数字分词

对本地Solr服务器添加IK中文分词器实现全文检索功能

Solr集成IK中文分词器

lucene_07_solr使用IK分词器