Elasticsearch字符过滤器
Posted 九师兄
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Elasticsearch字符过滤器相关的知识,希望对你有一定的参考价值。
1.概述
官网:https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-charfilters.html
1.1 字符过滤器
字符过滤器用于在将字符流传递给标记器之前对其进行预处理。
字符过滤器以字符流的形式接收原始文本,并可以通过添加、删除或更改字符来转换流。例如,字符过滤器可用于将印度-阿拉伯数字 (٠ ١٢٣٤٥٦٧٨ ٩ ) 转换为它们的阿拉伯-拉丁数字 (0123456789),或<b>从流中去除 html 元素等
。
Elasticsearch 有许多内置的字符过滤器,可用于构建 自定义分析器。
1.2 html_strip字符过滤器
该html_strip字符过滤带出HTML元素,比如<b>像和解码HTML实体&。
1.3 映射字符过滤器
该Mapping Character 过滤器替换指定更换指定的字符串中
以上是关于Elasticsearch字符过滤器的主要内容,如果未能解决你的问题,请参考以下文章
elasticsearch代码片段,及工具类SearchEsUtil.java