solr学习
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了solr学习相关的知识,希望对你有一定的参考价值。
当 Solr 在 Tomcat 服务器上部署成功后,我们可以登录 Solr 网页版的管理界面进行基本的操作。
一、首先来了解一下 Solr 页面各个功能模块的基本功能是什么?这里主要包括 Dashboard(仪表盘)、Logging(日志)、 Core Admin(索引库管理)、 Java Properties(Java 属性)、 Thread Dump(线程管道)、 Core Selector(Core 选择器)几部分组成,接下来将一一介绍。
二、Dashboard(仪表盘):包含 solr 搭建路径、版本信息,还有系统内存、jvm 内存和 jvm 参数等信息。
三、日志:用来查看警告或异常的信息,黄色代表警告,红色代表异常
在这里我们可以看到 【Level】选项
在 【Level】 中可以看到 ALL、TRACE、DEBUG、INFO、WARN、ERROR、FATAL、OFF、UNSET 几个可选项。Level 是用来控制相关类日志的显示信息的内容,其中:
ALL:显示全部信息
INFO:除了正常信息,其余信息全部显示
WARN:显示警告信息
ERROR:显示异常信息
UNSET:移除之前设置的信息
其他信息不再赘述(但是本人设置了也没有看到什么效果,[汗].......)
四、索引库管理:Core 管理,索引库优化等。主要包括 Add Core(添加 Core)、Unload(卸载 Core)、Rename(重命名 Core)、Optimize(优化索引库)几个功能
其中:
instanceDir:代表当前 Core 的根目录
dataDir:代表当前 Core 索引文件的存放目录
numDocs:代表当前 Core 索引文档数量。它可能大于 xml 文件个数,因为一个 xml 文件可能存在多个 <doc> 标签。
maxDoc:代表当前 Core 最大索引文档数量。它可能因为重复提交时 maxDoc 就会变大。
(关于 numDocs 和 maxDoc 具体意义我也不是很清楚......)
四、Select Core(选择 Core):选择相应的 Core 进行操作。
1、Overview(概览):选择 Core 的基本信息。
2、Analysis 分词器检验:用来校验所引用分词器的效果。其中 Field Value(Index) 代表需要分词的文本,Field Value(Query) 代表分词标准
其中:
SF:StopFielter,代表停止词
LCF:LowerCaseFielter,代表忽略大小写
ST:(不知道)
五、Config 就是 solrconfig.xml 文件
六、Dataimport:是从数据库中导入索引文件
七、Document(从文件中导入数据):通过该界面,我们可以选择相应的文件向服务器中导入索引文件。
1、DocumentType:导入文件的形式:
File Upload:从文件中导入,即上传文件
JSON:在 Document(s)中写入特定格式的 JSON 文件
XML:在 Document(s)中写入特定格式的 XML 文件
2、Document(s):写入特定格式的 JSON 或 XML 文件
3、CommitWithin:提交的最大数量
4、Overwrite:是否覆盖(如果两个索引文件的 ID 相同,是否覆盖旧的索引文件)
5、Boot(权重):如果想对不同类型的文章,或者字段设置不同的权重,或者对不同的搜索词语设置权重。但是这样会消耗内存。
1)、添加 JSON 格式文件
2)添加 XML 文件
3)、添加物理文件
八、Query(查询、重要):查询索引文档
1、q:查询参数,格式 FieldName:FieldValue,查询忽略大小写,单词匹配。例如:name:solr(查找 name 中包含 solr 的全部数据)。
2、fq:过滤查询参数,在 q 的查询结果上进一步筛选结果。例如:id:1212(在 name 中包含 solr 的结果上查找 id 为 1212 的数据)。
3、sort:排序,格式:fieldName desc|asc [,fieldName desc|asc ]。例如:name desc 按 name 属性降序排列
4、start,rows:返回结果从第几行显示,一共显示多少行。分页中用到
5、fl:字段过滤,返回结果中显示的 Field 。例如: id,name :返回结果中只包含 id 和 name 字段值,其他字段不显示
6、Raw Query Parameters:组合查询条件,相当于多个 q
7、wt : 输出结果格式。
8、indent:返回结果是否缩进。通常调试 XML 结果用
9、debugQuery:是否显示 Debug 信息。
10、dismax:它是基于 Lucene 的 DisjunctionMaxQuery 的扩展,用来取得文档最大打分(设置权重)
11、edismax:dismax 的加强版
12、hl:高亮显示
13、facet:Solr高级查询facet
14、spatial:空间查询
15、spellcheck:拼写检查
以上是关于solr学习的主要内容,如果未能解决你的问题,请参考以下文章