架构师成长记_第八周_10_ES-分词与五种内置分词器

Posted 流浪少年的梦

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了架构师成长记_第八周_10_ES-分词与五种内置分词器相关的知识,希望对你有一定的参考价值。

ES-分词

PS:

内置默认的分词器是不支持中文的, 中文的话会将每个字进行拆分

1. 全局分析方式(_analyze)

POST: http://192.168.92.140:9200/_analyze

{
    "analyzer": "standard",
    "text": "I study at home"
}

在这里插入图片描述

2. 指定字段分析方式(索引名/_analyze)

POST: http://192.168.92.140:9200/my_doc/_analyze

{
    "analyzer":"standard",
    "text": "My name is Peter Parker, I am a Super Hero. "
}

在这里插入图片描述

ES-五种内置分词器介绍

1 标准分词器 standard

在这里插入图片描述

2 非字母分词器 simple

在这里插入图片描述

3 空格拆分分词器 whitespace

在这里插入图片描述

4 智能化分词器(会去掉英文中无意义的词a/an/is/the等) stop

在这里插入图片描述

5 关键字分词器(内容不会进行拆分) keyword

在这里插入图片描述

以上是关于架构师成长记_第八周_10_ES-分词与五种内置分词器的主要内容,如果未能解决你的问题,请参考以下文章

架构师成长记_第八周_11_ES- ik中文分词器与自定义中文词库

架构师成长记_第八周_17_ES- 深度分页

架构师成长记_第八周_17_ES- 深度分页

架构师成长记_第八周_17_ES- 深度分页

架构师成长记_第八周_18_ES- 批量查询

架构师成长记_第八周_18_ES- 批量查询