ElasticSearch中分词器(基于英文的分词器)
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ElasticSearch中分词器(基于英文的分词器)相关的知识,希望对你有一定的参考价值。
参考技术A 第一种使用standard,也是默认的分词器使用_analyze分词器,可以在JSON字符串里面添加filed属性来搜索对应的具体字段,ES会自动把对应的数值里面的大写转换成小写,比如字符串里面的China到了分词器以后就是china。
第二种使用simple
其实这也是ES的简单用法,大家可以发现使用simple分词器,可以轻松的过滤非字母的字段,所以文中的1已经被过滤了,而don和t也会按照符号被区分出来
第三种使用whitespace
从字面意思就可以了解到是按照空格来区分的。文中的Parck,I之间并没有空格,所以不会被按照空格所切分。而且使用这种分词方式,并不会把字符串中的大写字母转换为小写字母,而是会保持原样。
第四种是使用stop分词器
这种分词器会将字符串中的无意义的单词自动去除,可以看到下图中的My name is Peter中的is已经被忽略。
第五种是使用keyword分词器
使用这种分词器,ES将不会对字符串进行任何操作,会保留原文字,当做关键字来查询。可以见下图,并不会拆分文字。
以上是关于ElasticSearch中分词器(基于英文的分词器)的主要内容,如果未能解决你的问题,请参考以下文章