solr服务器

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了solr服务器相关的知识,希望对你有一定的参考价值。

目标:

solr的概念
solr服务器的搭建和使用
solr中导入数据库数据
项目中怎么使用solr实现商品搜索功能

一.solr相关概念

1.1 什么是Solr?

solr是一个独立的企业级搜索应用服务器,它是对外提供类似于web-service的api接口,用户可以通过http请求,发送一定格式的xml数据到solr,生成索引,也可以发送http get请求,请求solr服务器查询数据,将查询出的数据也是以xml格式返回.

1.2.为什么要用solr?

1.数据库的模糊查询没有分词的功能,solr有,可以更有效的查询到我们需要的数据

2.从solr 服务器中查询数据会比从数据库查询速度要快.

1.3.solr的工作方式

文档通过Http利用XML 加到一个搜索集合中。Solr查询该集合也是通过http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。

1.4. solr特点

1.高级全文搜索能力:由Lucene 提供支持,Solr可实现强大的匹配功能,包括短语,通配符,联接,分组以及任何数据类型 .

2.拥有基于标准的开放式接口- XML、JSON 和 HTTP

3.综合的管理界面

4.高度的可扩展性和容错性

5.能够实时索引

6.可扩展的插件架构,Solr可以和Hadoop一起使用。由于Hadoop处理大量数据,Solr帮助我们从这么大的源中找到所需的信息。不仅限于搜索,Solr也可以用于存储目的。像其他NoSQL数据库一样,它是一种非关系数据存储和处理技术。

1.5.solr版本和jdk需求关系

版本 发布时间 说明

1.1 2007-01-18 -

....

4.0.0 2013-01-16 Java 1.6 以上,ZooKeeper 3.3.6;引入solrcloud

....

4.7.1 2014-04-01 Java 1.6 以上,最后一个采用旧版配置方法版本

4.8.0 2014-04-27 Java 1.7 以上,ZooKeeper 3.4.6

....

6.0.0 2016-04-07 Java 1.8 以上,Jetty 9.3.8

.....

1.6. Solr 相关链接

​ Solr 各版本下载地址:​​http://archive.apache.org/dist/lucene/solr/​

​ Solr 官方网站:​​http://lucene.apache.org/solr/resources.html​

​ 详细的solr中文手册链接:​​https://www.w3cschool.cn/solr_doc/​

二.solr的安装

2.1 下载jar 7.6.0

2.2 解压

解压出来的文件目录


2.3 启动服务器

2.4访问

输入: ​​http://localhost:8983​​

三 创建core

在solr中,每一个core代表一个索引库,里面保存索引数据以及配置信息

solr中可以有多个core,也就相当于mysql服务器下可以多个数据库

3.1 方法1: 用命令创建

  1. solr create -c core名称
  2. core的存放路径

3.2 方法2:界面创建

1.在solr-7.6.0/server/solr 文件夹下创建一个core文件夹 ,取名为students(商城项目里取名为goods)

  1. 将C:\\solr-7.6.0\\server\\solr\\configsets\\\\_default下的conf文件复制一份到students(或goods)文件夹下
    3.在solr界面Add Core,(之前取名goods的 这里名字就为goods)

四. 添加中文分词

选择刚才创建的core,点击Analysis进入分词分析页面,输入要分词的句子,选择分词库,点击分析按钮,即可看到分词结果

solr默认不支持中文分词

4.1测试自带的中文分词(商城项目配置 跳过这一步 直接用后面的ik分词器)

4.1.1 添加中文分词插件

solr 7.6中自带中文分词插件,将solr-7.6.0\\contrib\\analysis-extras\\lucene-libs\\lucene-analyzers-smartcn-7.6.0.jar 复制到 solr-7.6.0\\server\\solr-webapp\\webapp\\WEB-INF\\lib 目录中

4.1.2配置中文分词

修改 solr-7.6.0\\server\\solr\\articles【创建的core的名称】\\conf\\managed-schema文件

添加我们的中文配置【在eclipse/idea等工具里打开,记事本打开容易出现编码问题】


<!-- Chinese -->
<fieldType name="text_cn" class="solr.TextField" positionIncrementGap="100">

<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>

<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>

</fieldType>

4.1.3重启solr,测试中文分词

solr restart -p 8983

4.2 测试中文分词起ik-analyzer

4.2.1 下载ik-analyzer-7.6.0.jar包

并添加到solr-7.6.0\\server\\solr-webapp\\webapp\\WEB-INF\\lib 目录中

4.2.2 在创建的core里的配置文件managed-schema.xml中添加

<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>

4.2.3 重启服务器, 测试

solr restart -p 8983

五.导入数据库中数据

  1. 将数据库jar包(在发你们的solr资料文件里)


和solr-7.6.0\\\\dist下的dataimporthandler-7.6.0架包 (注意是mysql驱动和dataimport两个jar包)复制到 C:\\solr-7.6.0\\server\\solr-webapp\\webapp\\WEB-INF\\lib


  1. 创建data-config.xml文件

goods/conf文件夹下创建mysql-db文件夹,然后在mysql-db文件夹中创建data-config.xml文件,文件中添加如下内容

<?xml version="1.0" encoding="utf-8" ?>
<dataConfig>
<dataSource type="JdbcDataSource"
driver="com.mysql.jdbc.Driver"
url="jdbc:mysql://localhost:3306/sc"
user="root"
password="root"
/>

<document>
<entity name="goods" query="select goods_id,goods_name,sales_price,goods_img,cid from goods">
<field column="goods_id" name="id" />
<field column="goods_name" name="goodsName" />
<field column="sales_price" name="salesPrice" />
<field column="goods_img" name="goodsImg" />
<field column="cid" name="cid" />
</entity>

</document>
</dataConfig>
  1. 添加document中的字段
    在managed-schema.xml文件中添加


注意: id,version,root 不能删除

_text_ 不需要 可以删除

```
<field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" />
<!-- docValues are enabled by default for long type so we dont need to index the version field -->
<field name="_version_" type="plong" indexed="false" stored="false"/>
<field name="_root_" type="string" indexed="true" stored="false" docValues="false" />
<field name="goodsName" type="text_ik" indexed="true" stored="true" multiValued="false" />
<field name="salesPrice" type="plong" indexed="true" stored="true" multiValued="false" />
<field name="goodsImg" type="string" indexed="true" stored="true" multiValued="false" />
<field name="cid" type="string" indexed="true" stored="true" multiValued="false" />
```
  1. 导入data-config.xml文件
    在solrconfig.xml文件中添加
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
<lst name="defaults">
<str name="config">mysql-db/data-config.xml</str>
</lst>
</requestHandler>
  1. 重启solr
  2. 导入数据
  1. 测试查询

六. ssm中使用solr

  1. 添加jar包
<!-- solr jar包 -->
<dependency>
<groupId>org.apache.solr</groupId>
<artifactId>solr-solrj</artifactId>
<version>7.6.0</version>
</dependency>
  1. 在spring.xml中配置
<!-- 配置solr客户端对象 -->
<bean id="httpSolrClient" class="org.apache.solr.client.solrj.impl.HttpSolrClient">
<constructor-arg name="builder" value="http://localhost:8983/solr/goods" />
</bean>
  1. 修改pojo中goods类
  2. 控制层写solr查询操作
@RequestMapping("showGoodsByWhere2")
public String search2(@RequestParam(name = "pageIndex",defaultValue = "1") int pageIndex, int cid,@RequestParam(name = "keyword",defaultValue = "西") String keyword) throws IOException, SolrServerException
//创建一个query对象
SolrQuery solrQuery=new SolrQuery();
//设置默认的查询范围
solrQuery.set("df", "goodsName");
//设置查询条件
solrQuery.setQuery(keyword+"*");
//设置过滤条件
solrQuery.setFilterQueries("cid:"+cid);
//设置排序条件
solrQuery.setSort("goodsPrice",ORDER.desc);

solrQuery.addField("id");
solrQuery.addField("goodsName");
solrQuery.addField("salesPrice");
solrQuery.addField("goodsImg");
//solrQuery.addField("cid");
solrQuery.setStart(0);
//每页显示多少行
solrQuery.setRows(2);
//设置高亮(开启)
solrQuery.setHighlight(true);
//设置高亮域
solrQuery.addHighlightField("goodsName");
//设置高亮前缀
solrQuery.setHighlightSimplePre("<em>");
//设置高亮后缀
solrQuery.setHighlightSimplePost("</em>");

// 创建组合条件串
// StringBuilder params = new StringBuilder("cid:" + cid);
// params.append(" and goodsName:"+keyword);
// solrQuery.setQuery(params.toString());

//将查询对象传递到服务器端
QueryResponse queryResponse= httpSolrClient.query(solrQuery);

httpSolrClient.commit();

List<Goods> list= queryResponse.getBeans(Goods.class);

System.out.println(list.toString());
// ModelAndView modelAndView=new ModelAndView();
//modelAndView.addObject("goodsList",list);
// modelAndView.setViewName("searchList");

//return modelAndView;
return "success";

以上是关于solr服务器的主要内容,如果未能解决你的问题,请参考以下文章

SolrSolr实现简单的类似百度搜索高亮功能-2代码

基于句子而不是整个字段值构建 Solr 建议

Solr自学笔记 2 —— Solr 查询,排序, 高亮

在Lucene或Solr中实现高亮的策略

在Lucene或Solr中实现高亮的策略

Solr、sunburnt (python) 和高亮显示:操作方法?