solr 常见的问题整理 -费元星

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了solr 常见的问题整理 -费元星相关的知识,希望对你有一定的参考价值。

本文是我在开发过程中遇到的一些问题的整理,有些摘自网上别人的方法。

1. org.apache.solr.client.solrj.SolrServerException: Timeout occured while waiting response from server at: http://localhost/solr请求超时

    解决方法:设置setConnectionTimeout和setSoTimeout为1分钟

2. org.apache.solr.common.SolrException: undefined field text

    解决方法: 设置solrConfig.xml <str name="df">id</str> 默认是text

 

3. org.apache.solr.common.SolrException: Invalid Date String时间格式化问题

    主要是Solr使用的是标准的格林威治(GMT)时间 这种(yyyy-MM-dd‘T‘HH:mm:ss.SSS‘Z‘)北京在东八区 默认时间会-8小时

所以为了满足他这个减8 我的做法是在创建索引格式化日期类型的时候 判断下 把它时间+8 。

所以重新创建一个SolrEntityBinder类 此类是完全copy的DocumentObjectBinder. 只修改了一处。

修改了类中toSolrInputDocument方法

 

 

[html] view plain?
  1. <span style="color:#3333ff;"> //判断是否是日期-------------///  
  2.  if(field.type==Date.class){  
  3.     Date d = (Date)field.get(obj);  
  4.     Calendar cal = Calendar.getInstance();  
  5.     cal.setTimeInMillis(d.getTime());  
  6.     cal.add(Calendar.HOUR, 8);  
  7.     d = cal.getTime();  
  8.     doc.setField(field.name,d,1.0f);  
  9.  }else{  
  10.   doc.setField(field.name, field.get(obj), 1.0f);  
  11. }</span>  

4.Solr查询字符串空值

    有时候需要查询某个字段为空的记录,比如当solr做facet时,某个域为空的记录被统计,故也会被查询。
一个例子是职位记录,其中某种原因公司可能为空。这时我们如果想查询公司名称为空的记录可以采用如下语法实现(似乎目前为止只有此方法可行):
-company:[* TO *]  这样你会看到结果集中的记录将含有所有公司名称为空的记录。

 

5.Solr竞价排名功能

    假如你有3个doc想让它们有竞价排名,那就配这3个solr会把这3个放前面,然后是按照默认排序的其他doc 。
参考wiki:http://wiki.apache.org/solr/QueryElevationComponent

6.Solr DisMax 分析

        要用dismax,就必须启用,在solr1.3以后,solr的dismax功能通过 DisMaxQParserPlugin 来解析了。
我测试的版本是3.3,是通过在查询url里添加defType=dismax来启用dismax功能的。通过qt=dismax的话不会起作用的。
通过 defType=dismax 时,Solr 的QueryComponent组件的prepare的方法会取到defType参数的值,去创建对应的quey解析器。

7.Solr 跨核检索

    你在查询的条件里面加上shards=localhost:9095/solr/core0,localhost:9095/solr/core1 。

8.Solr 首位*检索

    solr 支持 *在第一位的搜索,只是性能不好,要扫描全部的倒排链。

以上是关于solr 常见的问题整理 -费元星的主要内容,如果未能解决你的问题,请参考以下文章

Solr请求概念和配置详解

搜索引擎solr简介

Solr In Action 中文版 第一章

如何针对生产调整Apache Solr 的内存

SOLT/SSLT/SSST/SOLR/LRL都是什么?

Elasticsearch 可视化管理工具