ElasticSearch中分词器(基于英文的分词器)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ElasticSearch中分词器(基于英文的分词器)相关的知识,希望对你有一定的参考价值。

参考技术A 第一种使用standard,也是默认的分词器

使用_analyze分词器,可以在JSON字符串里面添加filed属性来搜索对应的具体字段,ES会自动把对应的数值里面的大写转换成小写,比如字符串里面的China到了分词器以后就是china。

第二种使用simple

其实这也是ES的简单用法,大家可以发现使用simple分词器,可以轻松的过滤非字母的字段,所以文中的1已经被过滤了,而don和t也会按照符号被区分出来

第三种使用whitespace

从字面意思就可以了解到是按照空格来区分的。文中的Parck,I之间并没有空格,所以不会被按照空格所切分。而且使用这种分词方式,并不会把字符串中的大写字母转换为小写字母,而是会保持原样。

第四种是使用stop分词器

这种分词器会将字符串中的无意义的单词自动去除,可以看到下图中的My name is Peter中的is已经被忽略。

第五种是使用keyword分词器

使用这种分词器,ES将不会对字符串进行任何操作,会保留原文字,当做关键字来查询。可以见下图,并不会拆分文字。

以上是关于ElasticSearch中分词器(基于英文的分词器)的主要内容,如果未能解决你的问题,请参考以下文章

ElasticSearch 中文分词器对比

ElasticSearch最全分词器比较及使用方法

Elasticsearch中的分词器比较及使用方法

IK 分词器和ElasticSearch集成使用

为Elasticsearch添加中文分词,对比分词器效果

Elasticsearch 7.X 中英混合分词器 Smart Chinese 使用