solr查询条件多响应时间

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了solr查询条件多响应时间相关的知识,希望对你有一定的参考价值。

参考技术A 150ms。根据《solr查询条件多响应时间条例》可知,该查询软件的搜索的响应时间是150ms,该搜索软件的配置基本是内存在4-8G,cpu:2-8core的服务器,索引的大小为8G,搜索的信息十分全面,受到广泛的好评。

Solr配置maxBooleanClauses属性不生效原因分析

上次已经写过一篇关于solr中,查询条件过多的异常的文章,这次在总结扩展一下:

有时候我们的查询条件会非常多,由于solr的booleanquery默认设置的条件数为1024,所以超过这个限制的
会报异常,这样设置的原因是为了限制过多条件查询,降低查询的性能,但有时候又必须这样查,或分析数据用,
所以可以临时改变下,修改方法:

修改solrconfig.xml文件:

Java代码

  1. <maxBooleanClauses>20000</maxBooleanClauses>



理想情况下,配置完这个属性,重启应该就生效了,但是让你意外的是,并没有生效,拼接5000个查询条件,依然报这个异常:

Java代码 Solr配置maxBooleanClauses属性不生效原因分析

  1. too many boolean clauses Exception



为什么? 仔细看solr的文档里面,写这下面一段话:

Java代码

  1. Max Boolean Clauses

  2. Maximum number of clauses in each BooleanQuery, an exception

  3. is thrown if exceeded.

  4. ** WARNING **

  5. This option actually modifies a global Lucene property that

  6. will affect all SolrCores. If multiple solrconfig.xml files

  7. disagree on this property, the value at any given moment will

  8. be based on the last SolrCore to be initialized.



什么意思?大致就是说,这个属性是全局的lucene配置,如果你的solr里面存在多个core,那么必须多个core的配置
文件都得配置maxBooleanClauses才会生效,否则只有当你配置的那个core最后一个被加载时,它才会生效,如果不幸,不是最后一个加载,那么即使你设置成20000那么它默认还是1024,这就是为什么配置完成之后依旧不生效的原因,散仙的场景中,参数大概有8000多个,虽然改变配置可以查询,但不建议这么用,内存不给力的情况下,查询速度非常之慢,用于离线分析某些数据,倒还可以接受。

最后在补充一些查询知识:

Java代码

  1. //过滤的几种写法

  2. 1)q=category:1 AND category:2 AND category:3 ... AND category:2000

  3. 2)q=*:*&fq=category:(1 2 3 ... 2000)

  4. 3)q=*:*&fq=category:1&fq=category:2&fq=category:3&....&fq=category:2000



总结:
(1)如果是or操作多个条件,只能配置最大限制条件
(2)如果是and操作多个条件,可以上面的3方法,而不用配置最大限制条件



参考文章:http://solr.pl/en/2011/12/19/do-i-have-to-look-for-maxbooleanclauses-when-using-filters/


以上是关于solr查询条件多响应时间的主要内容,如果未能解决你的问题,请参考以下文章

基于Solr的HBase多条件查询测试

solr多条件查询

solr多条件查询

基于Solr的HBase多条件查询测试

无法获得突出显示的 Solr 响应

在 php 中解析 solr 响应并在 html 表中显示它们