elasticsearch 在查询中文时需要分字

Posted dcxmaozi

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了elasticsearch 在查询中文时需要分字相关的知识,希望对你有一定的参考价值。

 作为新人的我,在使用的elasticsearch 时,常遇到一些问题,而今天遇到的问题就是:在使用elasticsearch 搜索中文时,无返回结果?

问题描述如下: 
1.在kibana 上查看日志的内容是可以用中文进行搜索的,如下图所示: 
技术分享

然而,在我的代码里用中文进行查询时,却只会返回空,查询时使用的代码如下:

    /**
     * 执行搜索
     * 
     * @param queryBuilder
     * @param indexname
     * @param type
     * @return
     */
    public void searcher(QueryBuilder queryBuilder, String indexname,String type) {
                SearchRequestBuilder srbuilder = client.prepareSearch(indexname)
                  .setTypes(type)
                  .setQuery(queryBuilder)
                  .addHighlightedField("*")
                  .setHighlighterRequireFieldMatch(false)
                  .setFrom(0)
                  .setSize(1000)
                  .setExplain(true);
        SearchResponse searchResponse = srbuilder.execute().actionGet();
        //打印查询体
        System.out.println("--->"+srbuilder.toString());
        //打印返回结果
        System.out.println(">>>>"+searchResponse.toString());
        SearchHits hits = searchResponse.getHits();
        System.out.println("查询到记录数=" + hits.getTotalHits());
    }

    public static void main(String[] args) throws IOException {
        ElasticSearchHandler esHandler = new ElasticSearchHandler();
        // 查询条件
        String type = "system";
        String indexname = "logstash-2016-06-11";
        QueryBuilder queryBuilder = QueryBuilders.termQuery("message", "测试");

        BoolQueryBuilder bool = QueryBuilders.boolQuery();
        bool.must(queryBuilder);
        esHandler.searcher(bool, indexname,type);
    }

 

查询体: 
技术分享 
返回的结果: 
技术分享

到底是啥原因呢?在网上找了很久都没有结果,只能靠自己摸索了,终于在楼主的几经艰苦之下找到了问题原因。

问题原因其实很简单:elasticsearch 里默认的IK分词器是会将每一个中文都进行了分词的切割,所以你直接想查一整个词,或者一整句话是无返回结果的

找了到原因,那解决办法就简单了,只需要在查询时,先把你要查询的内容切分成一个一个的字分别构成查询体,再组合在一起即可,如下所示。

public static void main(String[] args) throws IOException {
        ElasticSearchHandler esHandler = new ElasticSearchHandler();
        // 查询条件
        String type = "system";
        String indexname = "logstash-2016-06-11";
        QueryBuilder queryBuilder = QueryBuilders.termQuery("message", "测");
        QueryBuilder queryBuilder2 = QueryBuilders.termQuery("message", "试");

        BoolQueryBuilder bool = QueryBuilders.boolQuery();
        bool.must(queryBuilder);
        bool.must(queryBuilder2);
        esHandler.searcher(bool, indexname,type);
    }

这一次的查询体: 
技术分享 
查询结果: 
技术分享

如果有更多,更好的解决方法,欢迎大家在评论区一起交流交流,谢谢。









以上是关于elasticsearch 在查询中文时需要分字的主要内容,如果未能解决你的问题,请参考以下文章

尝试在 presto ( spark ) 上运行 Elasticsearch 查询时连接被拒绝

ElasticSearch中文索引优化问题

使用Elasticsearch查询字段的所有唯一值

elasticsearch基本查询笔记(三)-- es查询总结

ElasticSearch嵌套查询无法按预期工作

elasticsearch获取大批量数据时 深度分页(from&size) VS scroll游标查询