elasticsearch 在查询中文时需要分字
Posted dcxmaozi
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了elasticsearch 在查询中文时需要分字相关的知识,希望对你有一定的参考价值。
作为新人的我,在使用的elasticsearch 时,常遇到一些问题,而今天遇到的问题就是:在使用elasticsearch 搜索中文时,无返回结果?
问题描述如下:
1.在kibana 上查看日志的内容是可以用中文进行搜索的,如下图所示:
然而,在我的代码里用中文进行查询时,却只会返回空,查询时使用的代码如下:
/**
* 执行搜索
*
* @param queryBuilder
* @param indexname
* @param type
* @return
*/
public void searcher(QueryBuilder queryBuilder, String indexname,String type) {
SearchRequestBuilder srbuilder = client.prepareSearch(indexname)
.setTypes(type)
.setQuery(queryBuilder)
.addHighlightedField("*")
.setHighlighterRequireFieldMatch(false)
.setFrom(0)
.setSize(1000)
.setExplain(true);
SearchResponse searchResponse = srbuilder.execute().actionGet();
//打印查询体
System.out.println("--->"+srbuilder.toString());
//打印返回结果
System.out.println(">>>>"+searchResponse.toString());
SearchHits hits = searchResponse.getHits();
System.out.println("查询到记录数=" + hits.getTotalHits());
}
public static void main(String[] args) throws IOException {
ElasticSearchHandler esHandler = new ElasticSearchHandler();
// 查询条件
String type = "system";
String indexname = "logstash-2016-06-11";
QueryBuilder queryBuilder = QueryBuilders.termQuery("message", "测试");
BoolQueryBuilder bool = QueryBuilders.boolQuery();
bool.must(queryBuilder);
esHandler.searcher(bool, indexname,type);
}
查询体:
返回的结果:
到底是啥原因呢?在网上找了很久都没有结果,只能靠自己摸索了,终于在楼主的几经艰苦之下找到了问题原因。
问题原因其实很简单:elasticsearch 里默认的IK分词器是会将每一个中文都进行了分词的切割,所以你直接想查一整个词,或者一整句话是无返回结果的。
找了到原因,那解决办法就简单了,只需要在查询时,先把你要查询的内容切分成一个一个的字分别构成查询体,再组合在一起即可,如下所示。
public static void main(String[] args) throws IOException {
ElasticSearchHandler esHandler = new ElasticSearchHandler();
// 查询条件
String type = "system";
String indexname = "logstash-2016-06-11";
QueryBuilder queryBuilder = QueryBuilders.termQuery("message", "测");
QueryBuilder queryBuilder2 = QueryBuilders.termQuery("message", "试");
BoolQueryBuilder bool = QueryBuilders.boolQuery();
bool.must(queryBuilder);
bool.must(queryBuilder2);
esHandler.searcher(bool, indexname,type);
}
这一次的查询体:
查询结果:
如果有更多,更好的解决方法,欢迎大家在评论区一起交流交流,谢谢。
以上是关于elasticsearch 在查询中文时需要分字的主要内容,如果未能解决你的问题,请参考以下文章
尝试在 presto ( spark ) 上运行 Elasticsearch 查询时连接被拒绝