Elasticsearchngram 分词器

Posted 九师兄

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Elasticsearchngram 分词器相关的知识,希望对你有一定的参考价值。

在这里插入图片描述

1.概述

官网:https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-ngram-tokenizer.html#analysis-ngram-tokenizer

实战请参考:【Elasticsearch】Elasticsearch能检索出来,但不能正确高亮怎么办 高亮部分数据 高亮指定字符串 Ngram

所述ngram标记生成器第一场所文本分解成单词每当遇到指定的字符列表中的一个,那么它发射 的n-gram的指定长度的每个单词的。

N-grams 就像一个在单词上移动的滑动窗口——指定长度的连续字符序列。它们对于查询不使用空格或具有长复合词的语言(如德语)很有用。

示例输出

在默认设置下,分ngram词器将初始文本视为单个标记,并生成具有最小长度1和最大长度的 N-gram 2:


                

以上是关于Elasticsearchngram 分词器的主要内容,如果未能解决你的问题,请参考以下文章

ik分词器热更新原理

11个Java开源中文分词器使用方法和分词效果对比

11大Java开源中文分词器的使用方法和分词效果对比

solr7.0.0+IKAnalyzer中文分词器V2012+tomcat9

java如何分词??

分词器的使用