Elasticsearch如何使用 Elasticsearch 6.2 搜索中文日语和韩语文本 - 第 3 部分:语言检测工具
Posted 九师兄
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Elasticsearch如何使用 Elasticsearch 6.2 搜索中文日语和韩语文本 - 第 3 部分:语言检测工具相关的知识,希望对你有一定的参考价值。
1.概述
翻译:https://www.elastic.co/cn/blog/how-to-search-ch-jp-kr-part-3
这是我有关中文、日语和韩语文本搜索的系列文章的第 3 部分。如果您还没有阅读有关分析工具的第 1 部分,您可能希望先阅读这一部分。如果您已阅读完第 1 部分,如何使用 Elasticsearch 6.2 搜索中文、日语和韩语文本 - 第 2 部分:多字段介绍了通过多字段对以多种语言编写的文档进行索引和搜索的方法。然而,如果不管任何语言,我们都将文本存储在四个字段内并使用四种分析工具进行分析,这可能会浪费我们的宝贵时间和存储空间。现在,我们将尝试通过语言检测工具来进行优化。和之前一样,文本仍然节选自 https://www.pyeongchang2018.com/en/about-the-games
语言检测工具
我们可以安装并利用可检测语言的摄取插件来节省时间和存储空间。下面的摄取管道会检测“正文”字段的语言并且会通过语言检测处理器将检测到的语言放到“语言”字段中,而非将其索引至主字段和三个子字段中。然后脚本处理器会将“正
以上是关于Elasticsearch如何使用 Elasticsearch 6.2 搜索中文日语和韩语文本 - 第 3 部分:语言检测工具的主要内容,如果未能解决你的问题,请参考以下文章
Elasticsearch:如何分析和优化 Elastic 部署的存储空间
Elastic:如何使用 Elasticsearch PHP 客户端创建简单的搜索引擎
Elastic:如何使用 Elasticsearch PHP 客户端创建简单的搜索引擎
如何使用 django-elasticsearch-dsl 将 django-modeltranslation 创建的列索引为 Elastic?