使用SolrJ(即java客户端)开发Solr。

Posted biehongli

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用SolrJ(即java客户端)开发Solr。相关的知识,希望对你有一定的参考价值。

1、什么是SolrJ呢?
  答:Solrj是访问Solr服务的java客户端,提供索引和搜索的请求方法,SolrJ通常在嵌入在业务系统中,通过SolrJ的API接口操作Solr服务。开始配置schema.xml,/home/hadoop/soft/solr-4.10.3/example/solr/collection1/conf。添加IK中文分析器,然后定义定义自己的业务域。

注意:

  a、Indexed,Indexed Field可以进行搜索和排序。你还可以在indexed Field上运行Solr分析过程,此过程可修改内容以改进或更改结果。
  b、Stored,Stored Field内容保存在索引中。这对于检索和醒目显示内容很有用,但对于实际搜索则不是必须的,例如,很多应用程序存储指向内容位置的指针而不是存储实际的文件内容。

 1 [root@localhost tomcat]# cd /home/hadoop/soft/solr-4.10.3/
 2 [root@localhost solr-4.10.3]# ls
 3 bin  CHANGES.txt  contrib  dist  docs  example  licenses  LICENSE.txt  LUCENE_CHANGES.txt  NOTICE.txt  README.txt  SYSTEM_REQUIREMENTS.txt
 4 [root@localhost solr-4.10.3]# cd example/solr
 5 [root@localhost solr]# ls
 6 bin  collection1  README.txt  solr.xml  zoo.cfg
 7 [root@localhost solr]# cd collection1/
 8 [root@localhost collection1]# ls
 9 conf  core.properties  data  README.txt
10 [root@localhost collection1]# cd conf/
11 [root@localhost conf]# ls
12 admin-extra.html              clustering    lang                         protwords.txt                            _schema_analysis_synonyms_english.json  solrconfig.xml  synonyms.txt      xslt
13 admin-extra.menu-bottom.html  currency.xml  mapping-FoldToASCII.txt      _rest_managed.json                       schema.xml                              spellings.txt   update-script.js
14 admin-extra.menu-top.html     elevate.xml   mapping-ISOLatin1Accent.txt  _schema_analysis_stopwords_english.json  scripts.conf                            stopwords.txt   velocity
15 [root@localhost conf]# 

然后添加IK中文分词器,自定义业务域:

技术图片

其中IK中文分词器,自定义业务域具体内容如下所示:

将这些添加完毕以后,重启Tomcat,然后看看,可以搜索到新增的业务域字段。

 1 <!-- 然后添加如下配置即可:-->
 2 <fieldType name="text_ik" class="solr.TextField">
 3 <!-- 索引时候的分词器 -->
 4 <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"></analyzer>
 5 <!-- 查询时候的分词器 -->
 6 <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"></analyzer>
 7 </fieldType>
 8 
 9 <!--IKAnalyzer Field-->
10 <!-- type="text_ik"代表使用了Ik中文分词器。 -->
11 <!-- indexed="true"代表进行索引操作。 -->
12 <!-- stored="true"代表将该字段内容进行存储。 -->
13 <field name="product_name" type="text_ik" indexed="true" stored="true" />
14 <field name="product_price" type="long" indexed="true" stored="true" />
15 <field name="product_picture" type="string" indexed="false" stored="true" />
16 <field name="product_description" type="text_ik" indexed="true" stored="true" />
17 <field name="product_catalog_name" type="string" indexed="true" stored="false" />

可以看到搜索到新增的业务域字段。

技术图片

2、然后你可以愉快的编程了,嘻嘻。

  1 package com.taotao.search.service;
  2 
  3 import java.io.IOException;
  4 import java.util.List;
  5 import java.util.Map;
  6 
  7 import org.apache.solr.client.solrj.SolrQuery;
  8 import org.apache.solr.client.solrj.SolrServer;
  9 import org.apache.solr.client.solrj.SolrServerException;
 10 import org.apache.solr.client.solrj.impl.HttpSolrServer;
 11 import org.apache.solr.client.solrj.response.QueryResponse;
 12 import org.apache.solr.client.solrj.response.UpdateResponse;
 13 import org.apache.solr.common.SolrDocument;
 14 import org.apache.solr.common.SolrDocumentList;
 15 import org.apache.solr.common.SolrInputDocument;
 16 import org.junit.Before;
 17 import org.junit.Test;
 18 
 19 /**
 20  * 使用SolrJ创建索引,通过调用SolrJ提供的API请求Solr服务,Document通过SolrInputDocument进行构建。
 21  * 创建索引,使用SolrJ创建索引,通过调用SolrJ提供的API请求Solr服务,Document通过SolrInputDocument进行构建。
 22  * 
 23  * @ClassName: ProductSolrUtils.java
 24  * @author: biehl
 25  * @since: 2019年9月12日 上午10:49:13
 26  * @Copyright: ©2019 biehl 版权所有
 27  * @version: 0.0.1
 28  * @Description:
 29  */
 30 public class ProductSolrUtils 
 31 
 32     // solr的地址路径
 33     private String solrServerUrl = "http://192.168.110.142:8080/solr-4.10.3/collection1";
 34     private SolrServer solrServer = null;
 35 
 36     /**
 37      * 
 38      */
 39     @Before
 40     public void before() 
 41         // 初始化执行
 42         // 1、创建SolrServer对象。创建一个HttpSolrServer对象
 43         solrServer = new HttpSolrServer(this.solrServerUrl);
 44     
 45 
 46     /**
 47      * 说明:根据id(唯一约束)域来更新Document的内容,如果根据id值搜索不到id域则会执行添加操作,如果找到则更新。
 48      * 
 49      * @throws IOException
 50      * @throws SolrServerException
 51      * 
 52      */
 53     @Test
 54     public void productSolrCreateIndex() 
 55         try 
 56             // 2、需要指定Solr服务的url
 57             // 3、创建一个文档对象SolrInputDocument
 58             SolrInputDocument document = new SolrInputDocument();
 59             // 4、向文档中添加域,必须写id域,域的名称必须在schema.xml中定义
 60             document.addField("id", "p0001");
 61             document.addField("product_name", "小米手机9x");
 62             document.addField("product_price", 8888);
 63             document.addField("product_picture", "好用得咧");
 64             document.addField("product_description", "什么玩意?");
 65             document.addField("product_catalog_name", "手机");
 66 
 67             // 5、把文档对象写入到索引库中
 68             // 向solr里面添加文档
 69             UpdateResponse response = solrServer.add(document);
 70             // 6、提交
 71             solrServer.commit();
 72          catch (Exception e) 
 73             e.printStackTrace();
 74         
 75     
 76 
 77     /**
 78      * 删除索引
 79      * 
 80      * 说明:deleteById(String id)根据id删除索引,此方法为重载方法,也可以传个多个id批量删除, 也可以调用deleteByQuery()
 81      * 根据查询条件删除
 82      */
 83     @Test
 84     public void taotaoSolrJDeleteById() 
 85         try 
 86             // 向solr里面添加文档
 87             // 1、创建SolrServer对象。创建一个HttpSolrServer对象
 88             // SolrServer server = new
 89             // HttpSolrServer("http://192.168.110.142:8080/solr-4.10.3/collection1");
 90 
 91             // 2、 删除操作,//根据id删除
 92             solrServer.deleteById("p0001");
 93 
 94             // 3、提交
 95             solrServer.commit();
 96          catch (SolrServerException e) 
 97             e.printStackTrace();
 98          catch (IOException e) 
 99             e.printStackTrace();
100         
101 
102     
103 
104     /**
105      * 删除索引,查询条件删除
106      * 
107      */
108     @Test
109     public void taotaoSolrJDeleteByQuery() 
110         try 
111             // 向solr里面添加文档
112             // 1、创建SolrServer对象。创建一个HttpSolrServer对象
113             // SolrServer server = new
114             // HttpSolrServer("http://192.168.110.142:8080/solr-4.10.3/collection1");
115 
116             // 2、 删除操作
117             solrServer.deleteByQuery("id:p0002");
118 
119             // 3、提交
120             solrServer.commit();
121          catch (SolrServerException e) 
122             e.printStackTrace();
123          catch (IOException e) 
124             e.printStackTrace();
125         
126     
127 
128     /**
129      * 
130      */
131     @Test
132     public void searchDocument() 
133         try 
134             // 1、创建一个SolrServer对象
135             // SolrServer solrServer = new
136             // HttpSolrServer("http://192.168.110.142:8080/solr-4.10.3/collection1");
137             // 2、创建一个SolrQuery对象
138             SolrQuery solrQuery = new SolrQuery();
139             // 3、设置查询条件,过滤条件,分页条件,排序条件,高亮
140             // key的q就是指查询条件。
141             // solrQuery.set("q", "*:*"); //等价于solrQuery.setQuery("*:*");
142             // 查询所有的不能指定高亮的。
143             // solrQuery.setQuery("*:*");// *:*是查询出所有的。
144             // 这里没有指定在那里域上面进行搜索,所以需要指定默认搜索域
145             solrQuery.setQuery("小米手机9");
146             // 分页默认是0-10。分页条件。
147             solrQuery.setStart(0);// 起始数
148             solrQuery.setRows(20);// 查询出多少条
149             // 设置默认搜索域。就是如果Query不设置查询那个字段,这里必须指定一个默认值,进行搜索。
150             solrQuery.set("df", "product_name");
151             // 设置高亮。
152             solrQuery.setHighlight(true);// 开启高亮
153             // 设置高亮显示的域
154             solrQuery.addHighlightField("product_catalog_name");
155             // 设置高亮显示的前缀和后缀
156             solrQuery.setHighlightSimplePre("<em>");
157             solrQuery.setHighlightSimplePost("</em>");
158 
159             // 4、执行查询,得到一个Response对象
160             QueryResponse response = solrServer.query(solrQuery);
161 
162             // 5、取出查询结果总记录数
163             SolrDocumentList solrDocumentList = response.getResults();
164             // 查询出结果总记录数
165             System.out.println("查询结果总记录数: " + solrDocumentList.getNumFound());
166 
167             for (SolrDocument solrDocument : solrDocumentList) 
168                 System.out.println("id : " + solrDocument.get("id"));
169                 // 取出高亮显示
170                 Map<String, Map<String, List<String>>> highlighting = response.getHighlighting();
171                 List<String> list = highlighting.get(solrDocument.get("id")).get("product_name");
172                 String product_name = "";
173                 if (list != null && list.size() > 0) 
174                     product_name = list.get(0);
175                  else 
176                     product_name = (String) solrDocument.get("product_name");
177                 
178                 System.out.println(product_name);
179                 System.out.println("product_price : " + solrDocument.get("product_price"));
180                 System.out.println("product_picture : " + solrDocument.get("product_picture"));
181                 System.out.println("product_description : " + solrDocument.get("product_description"));
182                 System.out.println("product_catalog_name : " + solrDocument.get("product_catalog_name"));
183                 System.out.println("=============================================");
184             
185 
186             // 提交
187             solrServer.commit();
188          catch (SolrServerException e) 
189             e.printStackTrace();
190          catch (IOException e) 
191             e.printStackTrace();
192         
193 
194     
195 
196 

查询删除效果如下所示:

技术图片



 

待续......

以上是关于使用SolrJ(即java客户端)开发Solr。的主要内容,如果未能解决你的问题,请参考以下文章

如何使用SOLRJ java客户端从SOLR获取列名(字段)?

我与solr--solrJ

SolrJ 的运用

solr 学习之solrJ

搜索引擎系列十:Solr(solrj 索引API 结构化数据导入)

使用Solrj Api和Kerberized Solr创建Solr客户端