方便Lucene高版本使用IKAnalyzer分词包

Posted 远洋号

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了方便Lucene高版本使用IKAnalyzer分词包相关的知识,希望对你有一定的参考价值。

why

IKAnalyzer是个很不错的中文分词工具,但已经不维护了,但只支持低版本的Lucene,为了兼容Lucene6.x版本,这里是小改动了一些然后放到github上,方便有需要的人使用。

也对Lucene源码比较熟,后面有必要再自己重新写个分词工具。

changes

  • Lucene的Analyzer抽象类有变。

  • Lucene的Tokenizer抽象类有变。

  • Lucene的BooleanQuery有变。

  • Lucene的QueryParser有变。

link

how to use

  •  clone 

  • mvn install

  • pom.xml

<dependency>
  <groupId>com.seaboat</groupId>
  <artifactId>IKAnalyzer</artifactId>
  <version>7.4.0</version>
</dependency>


====广告时间,可直接跳过====

鄙人的新书《Tomcat内核设计剖析》已经在京东预售了,有需要的朋友可以到  进行预定。感谢各位朋友。

=========================

欢迎关注:


以上是关于方便Lucene高版本使用IKAnalyzer分词包的主要内容,如果未能解决你的问题,请参考以下文章

Lucene使用IKAnalyzer分词实例 及 IKAnalyzer扩展词库

IKAnalyzer结合Lucene实现中文分词

solr 7.x 配置ikanalyzer

IK 分词器和ElasticSearch集成使用

ikanalyzer 可以做词性标注吗

Lucene使用IKAnalyzer分词