solr学习

Posted 2020-09-22

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了solr学习相关的知识，希望对你有一定的参考价值。

当 Solr 在 Tomcat 服务器上部署成功后，我们可以登录 Solr 网页版的管理界面进行基本的操作。

一、首先来了解一下 Solr 页面各个功能模块的基本功能是什么？这里主要包括 Dashboard（仪表盘）、Logging（日志）、 Core Admin（索引库管理）、 Java Properties（Java 属性）、 Thread Dump（线程管道）、 Core Selector（Core 选择器）几部分组成，接下来将一一介绍。

技术分享

二、Dashboard（仪表盘）：包含 solr 搭建路径、版本信息，还有系统内存、jvm 内存和 jvm 参数等信息。

技术分享

三、日志：用来查看警告或异常的信息，黄色代表警告，红色代表异常

技术分享

在这里我们可以看到【Level】选项

技术分享

在【Level】中可以看到 ALL、TRACE、DEBUG、INFO、WARN、ERROR、FATAL、OFF、UNSET 几个可选项。Level 是用来控制相关类日志的显示信息的内容，其中：

ALL：显示全部信息

INFO：除了正常信息，其余信息全部显示

WARN：显示警告信息

ERROR：显示异常信息

UNSET：移除之前设置的信息

其他信息不再赘述（但是本人设置了也没有看到什么效果，[汗].......）

技术分享

四、索引库管理：Core 管理，索引库优化等。主要包括 Add Core（添加 Core）、Unload（卸载 Core）、Rename（重命名 Core）、Optimize（优化索引库）几个功能

技术分享

其中：

instanceDir：代表当前 Core 的根目录

dataDir：代表当前 Core 索引文件的存放目录

numDocs：代表当前 Core 索引文档数量。它可能大于 xml 文件个数，因为一个 xml 文件可能存在多个 <doc> 标签。

maxDoc：代表当前 Core 最大索引文档数量。它可能因为重复提交时 maxDoc 就会变大。

（关于 numDocs 和 maxDoc 具体意义我也不是很清楚......）

四、Select Core（选择 Core）：选择相应的 Core 进行操作。

1、Overview（概览）：选择 Core 的基本信息。

技术分享

2、Analysis 分词器检验：用来校验所引用分词器的效果。其中 Field Value（Index）代表需要分词的文本，Field Value（Query）代表分词标准

技术分享

其中：

SF：StopFielter，代表停止词

LCF：LowerCaseFielter，代表忽略大小写

ST：（不知道）

五、Config 就是 solrconfig.xml 文件

六、Dataimport：是从数据库中导入索引文件

七、Document（从文件中导入数据）：通过该界面，我们可以选择相应的文件向服务器中导入索引文件。

技术分享

1、DocumentType：导入文件的形式：

File Upload：从文件中导入，即上传文件

JSON：在 Document（s）中写入特定格式的 JSON 文件

XML：在 Document（s）中写入特定格式的 XML 文件

2、Document（s）：写入特定格式的 JSON 或 XML 文件

3、CommitWithin：提交的最大数量

4、Overwrite：是否覆盖（如果两个索引文件的 ID 相同，是否覆盖旧的索引文件）

5、Boot（权重）：如果想对不同类型的文章，或者字段设置不同的权重，或者对不同的搜索词语设置权重。但是这样会消耗内存。

1）、添加 JSON 格式文件

技术分享

2）添加 XML 文件

技术分享

3）、添加物理文件

技术分享

八、Query（查询、重要）：查询索引文档

1、q：查询参数，格式 FieldName：FieldValue，查询忽略大小写，单词匹配。例如：name：solr（查找 name 中包含 solr 的全部数据）。

2、fq：过滤查询参数，在 q 的查询结果上进一步筛选结果。例如：id：1212（在 name 中包含 solr 的结果上查找 id 为 1212 的数据）。

3、sort：排序，格式：fieldName desc|asc [，fieldName desc|asc ]。例如：name desc 按 name 属性降序排列

4、start，rows：返回结果从第几行显示，一共显示多少行。分页中用到

5、fl：字段过滤，返回结果中显示的 Field 。例如： id，name ：返回结果中只包含 id 和 name 字段值，其他字段不显示

6、Raw Query Parameters：组合查询条件，相当于多个 q

7、wt ：输出结果格式。

8、indent：返回结果是否缩进。通常调试 XML 结果用

技术分享

技术分享

9、debugQuery：是否显示 Debug 信息。

10、dismax：它是基于 Lucene 的 DisjunctionMaxQuery 的扩展，用来取得文档最大打分（设置权重）

11、edismax：dismax 的加强版

12、hl：高亮显示

13、facet：Solr高级查询facet

14、spatial：空间查询

15、spellcheck：拼写检查

以上是关于solr学习的主要内容，如果未能解决你的问题，请参考以下文章

Solr学习总结Solr查询参数

Solr-5.3.0学习笔记Solr Admin UI

solr学习（安装与启动）