配置smartcn分词器

Posted miye

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了配置smartcn分词器相关的知识,希望对你有一定的参考价值。

  • 复制/opt/solr-7.7.1/contrib/analysis-extras/lucene-libs中的lucene-analyzers-smartcn-7.7.1.jar
    /opt/solr-7.7.1/server/solr-webapp/webapp/WEB-INF/lib

  • 编辑managed-schema文件加入
<!-- 配置smartcn分词器 -->
<fieldType name="text_smartcn" class="solr.TextField" positionIncrementGap="100">
  <analyzer type="index">
    <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
  </analyzer>
  <analyzer type="query">
    <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
  </analyzer>
</fieldType>
  • 测试分词效果

以上是关于配置smartcn分词器的主要内容,如果未能解决你的问题,请参考以下文章

Windows ElasticSearch中文分词配置

Elasticsearch 2.2.0 分词篇:中文分词

ElasticSearch:Java操作elasticsearch基于smartcn中文分词查询

Solr基础教程之solrconfig.xml

solr 中文分词器IKAnalyzer和拼音分词器pinyin

ElasticSearch第三步-中文分词