Solr简单总结

Posted lifuwei

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Solr简单总结相关的知识,希望对你有一定的参考价值。

Solr

运行Solr服务

方式一:Jetty服务器启动Solr

  1. 进入solr-4.10.2/example目录
  2. 打开命令行,执行java –jar start.jar命令,即可启动Solr服务
  3. 打开浏览器,通过http://localhost:8983/solr来访问Solr管理页面。

方式二:Tomcat服务器启动Solr

  1. 部署Web服务,将solr-4.10.2/example/webapps/solr.war复制到自己的tomcat/webapps目录中,并解压,然后删除solr.war文件
  2. 在Tomcat中加入相关jar包:将“resourcesolr在tomcat运行需要导入的jar包lib”下的jar包复制tomcat/webapps/solr/WEB-INF/lib下。
    并且把class/log4j.properties复制到tomcat/webapps/solr/WEB-INF下
  3. 修改Tomcat配置文件,指向Solr的索引库及配置目录。
    注意,这里可以指向solr-4.10.2/example/solr目录,如果想独立出来,也可以将这个solr文件夹复制出来到任意位置(不要出现中文),例如:例如:C:/tmp/solr
  4. 进入Tomcat文件夹,用记事本打开:tomcat/bin/catalina.bat文件,添加一条配置信息,指向我们的索引库及配置目录:set "JAVA_OPTS=-Dsolr.solr.home=C:/tmp/solr"
  5. 进入tomcat/bin目录,双击 startup.bat文件启动服务器
  6. 打开浏览器,访问http://localhost:8080/solr 进入Solr管理页面

Solr管理页面

技术分享图片

Dashboard仪表盘

显示solr服务及系统运行信息

Logging(日志)

solr运行的日志信息

Core Admin(Core管理)

在Solr中,每一个Core,代表一个索引库,里面包含索引数据及其配置信息。
Solr中可以拥有多个Core,也就同时管理多个索引库!就像在mysql中可以有多个database一样!

JavaProperties

Java运行环境信息

ThreadDump

solr运行线程信息

CoreSelector(Core选择器)

技术分享图片

技术分享图片

技术分享图片

技术分享图片

schema.xml

注意:在本文件中,有两个字段是Solr自带的字段,绝对不要删除:_version_节点和_root_节点

Field字段定义字段的属性信息段

属性及含义:
name:字段名称,最好以下划线或者字母开头
type:字段类型,指向的是本文件中的

FieldType指定数据类型

属性及含义:
name:字段类型的名称,可以自定义,

唯一主键

Lucene中本来是没有主键的。删除和修改都需要根据词条进行匹配。而Solr却可以设置一个字段为唯一主键,这样删改操作都可以根据主键来进行!

IK分词器

<fieldType name="text_ik" class="solr.TextField">
    <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

SolrJ的使用

添加或修改索引库数据

private static String baseURL = "http://localhost:8080/solr/core1";
@Test
public void createTest() throws Exception {
    //连接solr服务器
    HttpSolrServer solrServer = new HttpSolrServer(baseURL);
    //创建文档对象
    SolrInputDocument document = new SolrInputDocument();
    document.addField("id", "5");
    document.addField("title", "8848手机,钛合金外壳,注定不平凡");
    document.addField("content", "8848发发发");
    //向solr服务器写入文档
    solrServer.add(document);
    solrServer.commit();
}
@Test
public void create2Test() throws Exception {
    //连接solr服务器
    HttpSolrServer solrServer = new HttpSolrServer(baseURL);
    //创建文档对象
    Item item = new Item();
    item.setId("6");
    item.setTitle("金立M2017成功人士的标配");
    item.setContent("金立你值得拥有");
    //向solr服务器写入文档
    solrServer.addBean(item);
    solrServer.commit();
    
}
//添加@Field注解
public class Item{
    @Field
    private String id;
    @Field
    private String title;
    @Field
    private String content;
    public String getId() {
        return id;
    }
    public void setId(String id) {
        this.id = id;
    }
    public String getTitle() {
        return title;
    }
    public void setTitle(String title) {
        this.title = title;
    }
    public String getContent() {
        return content;
    }
    public void setContent(String content) {
        this.content = content;
    }
}

删除索引库数据

@Test
public void deleteTest() throws SolrServerException, IOException {
    // 连接solr服务器
    HttpSolrServer solrServer = new HttpSolrServer(baseURL);
    // 删除索引
    //solrServer.deleteById("6");
    solrServer.deleteByQuery("title:金立");
    // 提交
    solrServer.commit();
}

查询索引库数据

在创建SolrQuery时,我们填写的Query语句,可以有以下高级写法:

  1. 通配符?和 *:“*”表示匹配任意字符;“?”表示匹配出现的位置
  2. 布尔操作:AND、OR和NOT布尔操作(推荐使用大写,区分普通字段)
  3. 子表达式查询(子查询):可以使用“()”构造子查询。比如:(query1 AND query2) OR (query3 AND query4)
  4. 相似度查询:指定编辑距离的相似度查询:对模糊查询可以设置编辑距离,可选0-2的整数(默认为2):title:appla~1。
  5. 范围查询(Range Query):Lucene支持对数字、日期甚至文本的范围查询,并且两端范围。结束的范围可以使用“*”通配符。
    (1)日期范围(ISO-8601时间GMT):a_begin_date:[1990-01-01T00:00:00.000Z TO 1999-12-31T24:59:99.999Z]
    (2)数字:salary:[2000 TO *]
    (3)文本:entryNm:[a TO a]
@Test
public void queryTest() throws SolrServerException{
    // 连接solr服务器
    HttpSolrServer solrServer = new HttpSolrServer(baseURL);
    //创建查询条件对象
    SolrQuery params = new SolrQuery("*:*");
    //执行查询,获取响应数据
    QueryResponse response = solrServer.query(params);
    //获取数据结果集
    SolrDocumentList list = response.getResults();
    System.out.println("一共获取了" + list.size()+"条结果:");
    for (SolrDocument solrDocument : list) {
        System.out.println("id: " + solrDocument.getFieldValue("id"));
        System.out.println("title:" + solrDocument.getFieldValue("title"));
    }
}
@Test
public void queryBeanTest() throws SolrServerException{
    // 连接solr服务器
    HttpSolrServer solrServer = new HttpSolrServer(baseURL);
    //创建查询条件对象
    SolrQuery params = new SolrQuery("*:*");
    //执行查询,获取响应
    QueryResponse response = solrServer.query(params);
    List<Item> beans = response.getBeans(Item.class);
    System.out.println("一共获取了" + beans.size()+"条结果:");
    for (Item item : beans) {
        System.out.println("id: " + item.getId());
        System.out.println("title:" + item.getTitle());
    }
}

实现排序

@Test
public void querySortTest() throws SolrServerException, IOException {
    // 连接solr服务器
    HttpSolrServer solrServer = new HttpSolrServer(baseURL);
    // 创建查询条件对象,范围查询,包含两端
    SolrQuery query = new SolrQuery("*:*");
    // 设置查询的排序参数,1-排序的字段名,2-排序方式(ORDER:asc desc)
    query.setSort("id", ORDER.asc);
    // 执行查询,获取响应数据
    QueryResponse response = solrServer.query(query);
    // 获取结果集数据
    List<Item> list = response.getBeans(Item.class);
    System.out.println("总记录数  numFound:"+response.getResults().getNumFound());
    for (Item item : list) {
        System.out.println("id: " + item.getId());
        System.out.println("title:" + item.getTitle());
    }
}

实现分页

@Test
public void queryPageTest() throws SolrServerException, IOException {
    // 准备分页参数
    int pageNum = 1; //页码
    int pageSize = 2; //每页条数
    // 连接solr服务器
    HttpSolrServer solrServer = new HttpSolrServer(baseURL);
    // 创建查询条件对象
    SolrQuery params = new SolrQuery("*:*");
    // 设置查询的排序参数,1-排序的字段名,2-排序方式(ORDER:asc desc)
    params.setStart((pageNum-1)*pageSize);//设置起始条数
    params.setRows(pageSize);//设置每页条数
    // 执行查询,获取响应数据
    QueryResponse response = solrServer.query(params);
    // 获取结果集数据
    SolrDocumentList list = response.getResults();
    System.out.println("一共获取了" + list.size() + "条结果:");
    for (SolrDocument solrDocument : list) {
        System.out.println("id: " + solrDocument.getFieldValue("id"));
        System.out.println("title:" + solrDocument.getFieldValue("title"));
    }
}

实现高亮

@Test
public void highLightingTest() throws SolrServerException, IOException{
    // 初始化solrj服务
    HttpSolrServer server = new HttpSolrServer(baseURL);
    // 设置查询条件
    SolrQuery params = new SolrQuery("title:手机");
    // 设置前置标签
    params.setHighlightSimplePre("<em >");
    // 设置后置标签
    params.setHighlightSimplePost("</em>");
    // 添加高亮字段
    params.addHighlightField("title");
    // 执行查询
    QueryResponse queryResponse = server.query(params);
    // 外层的Map,key:id,value:id以外的其他高亮字段,可能有多个,也是一个Map
    // 内层的Map,key:高亮字段的名称,value:字段的内容,集合
    Map<String, Map<String, List<String>>> highlighting = queryResponse.getHighlighting();
    // 遍历map,获取结果
    Set<String> ids = highlighting.keySet();
    for (String id : ids) {
        System.out.println("id: " + id);;
        // 获取高亮字段的集合
        Map<String, List<String>> map = highlighting.get(id);
        // 获取高亮字段
        System.out.println(map.get("title").get(0));
        // 因为content不是高亮字段,所以打印出的内容为null
        System.out.println(map.get("content"));
    }
    
}









以上是关于Solr简单总结的主要内容,如果未能解决你的问题,请参考以下文章

solr分布式索引实战分片配置读取:工具类configUtil.java,读取配置代码片段,配置实例

Maven和Solr简单总结

在 solr 3.4 中放置突出显示片段配置的位置

Solr 高亮是不是还可以指示返回的片段在原始字段中的位置或偏移量?

Solr Highlighting:如何为同一字段请求多个片段长度?

Solr学习总结IK 中文分词的配置和使用