ES keyword
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ES keyword相关的知识,希望对你有一定的参考价值。
参考技术A es keyword分三类:1.keyword 2.constant_keyword 3.wildcard
官网一直没看懂wildcard,后面查文档,才发现wildcard分两阶段
1.n-gram(git pull n是5,出于存储性能考虑,实际n为3),做初筛。
2.doc value做二次精准筛选。
使用场景:模糊检索。
https://github.com/elastic/elasticsearch/issues/48852
https://github.com/elastic/elasticsearch/pull/49993
es 中的.keyword导致的 [categoryName] if different type, current_type [text], merged_type [keyword]报错解决(代码
一.项目启动时报了
mapper [categoryName] of different type, current_type [text], merged_type [keyword]
这样的错误,查看ES的映射发现字段categoryName的类型是:
"categoryName": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
ES会给未指定类型的字段自动匹配类型,所以对于String类型的字段就会出现动态映射的情况。
二.具体原因如下:
来自:https://www.codeleading.com/article/33052767848/
ES5.0及以后的版本取消了string类型,将原先的string类型拆分为text和keyword两种类型。它们的区别在于text会对字段进行分词处理而keyword则不会。
当你没有以IndexTemplate等形式为你的索引字段预先指定mapping的话,ES就会使用Dynamic Mapping,通过推断你传入的文档中字段的值对字段进行动态映射。例如传入的文档中字段price的值为12,那么price将被映射为long类型;字段addr的值为"192.168.0.1",那么addr将被映射为ip类型。然而对于不满足ip和date格式的普通字符串来说,情况有些不同:ES会将它们映射为text类型,但为了保留对这些字段做精确查询以及聚合的能力,又同时对它们做了keyword类型的映射,作为该字段的fields属性写到_mapping中。例如,当ES遇到string类型的字段"foobar": "some string"时,会对它做Dynamic Mapping
这就是造成部分字段还会自动生成一个与之对应的“.keyword”字段的原因。
三.解决方法
把原来的索引库给删了,重新导入数据
可以看到 重新导入数据后,只要是指定了数据类型的字段就不会出现动态映射的情况,项目也成功运行
以上是关于ES keyword的主要内容,如果未能解决你的问题,请参考以下文章