solr最佳实践
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了solr最佳实践相关的知识,希望对你有一定的参考价值。
管理页面
页面地址:http://{ip}:{port}/solr/#/
管理页面的data-import页可以手动重建索引,configuration指定了数据源,重建索引也可以通过http请求触发:
http://{ip}:{port}/solr/{coreName}/dataimport?command=full-import&clean=true&commit=true
管理页面的schema页用来配置索引字段。
每天晚上的定时全量重建索引是通过linux的crontab实现的。
部署路径下的主要目录和脚本
./:该目录下的upsolr.sh是solr的启动脚本,配置了jetty端口,jmx端口,远程调试端口,内存分配,垃圾回收等启动参数
./contexts:该目录下的solr-jetty-context.xml文件为jetty配置solr应用的war包信息,一般不用修改
./etc:该目录下的jetty.xml文件可配置jetty参数、jetty日志等信息,一般不用修改
./lib: jetty的相关jar包
./logs:日志文件路径
./resources:该目录下的log4j.properties文件是log4j的配置文件
./solr:该目录是solr各个core的配置和索引的存储路径,solr.xml文件配置core及core配置文件的路径{coreName}目录下的conf目录是该core的配置文件,data目录是该core的索引文件 conf目录下最重要的两个文件是db-data-config.xml和schema.xml db-data-config.xml配置了数据源,schema.xml配置了索引字段以及字段类型
./solr-webapp:solr的war包解压后的目录
./webapps:solr的war包的目录
增加节点
-
拷贝solr部署路径下的文件到新服务器的相应路径(拷贝时可去掉日志文件和索引文件以减小拷贝包的大小)
-
修改upsolr.sh中的相关配置,如果新服务器的路径不一致,需要修改./resources/log4j.properties中的日志文件路径
-
启动solr,重建索引,配置crontab定时任务(如果起不来可以修改upsolr.sh中的“> /dev/null 2>&1&”部分, 将启动输出重定向到一个文件,看报什么错)
-
修改dy-solrj中的相应配置文件,相关项目升级dy-solrj的jar包
-
通知运维修改相关域名代理的ip
增加/删除索引字段
修改./solr/{coreName}/conf/schema.xml文件,如果索引列名与视图列名不一致,需要在db-data-config.xml文件中配置映射关系
增加core
修改./solr/solr.xml文件,指定coreName和配置文件位置,配置文件可以从其他core拷贝,如果使用solrj还需要修改solrj相关代码
solr运行
启动服务器
bin/solr start
这将在后台启动服务器,默认在8983端口监听。bin/solr脚本允许你自定义启动Solr的方式。
查看如何使用bin/solr脚本
bin/solr -help
可以看到有10个命令,查看各个命令用法详情的方法如下。示例:查看启动的用法详情
bin/solr start -help
增加document
Solr的schema提供了内容如何结构化的方法,但是没有内容谈何结构化。Solr需要输入内容。
bin/post是用来索引文档的命令,使用-help可以看到相关使用信息。bin/post可以post各种类型的内容到Solr上。
bin/post -c fy example/exampledocs/*.xml
查询
现在已经完成了索引,可以查询。最简单的方式是构建一个包含查询参数的URL。
-
示例:查询video
http://localhost:8983/solr/fy/select?q=video
-
示例:查询video,但是文档只返回ID、name和price列
http://localhost:8983/solr/fy/select?q=video&fl=id,name,price
-
示例:查询在name field中有black的。如果没有指定field,将搜索默认filed(在schema中设置)
http://localhost:8983/solr/fy/select?q=name:black
-
可以提供fields范围。示例:查询price在0~400的
http://localhost:8983/solr/fy/select?q=price:[0%20TO%20400]
Faceted browsing是Solr关键特性的其中之一。它允许用户缩小搜索结果。示例:电商网站提供facets通过制造商和价格来缩小搜索结果。
-
Faceted信息在查询返回包中在第三部分。示例:
http://localhost:8983/solr/fy/select?q=*:*&facet=true&face.field=DistrictName
-
facet信息展示了每个DistrictName有多少结果。可以使用这些信息更轻松地缩小查询结果。你可以通过增加过滤条件来过滤结果。
http://localhost:8983/solr/fy/select?q=*:*&facet=true&face.field=DistrictName&facet.query=普陀
以上是关于solr最佳实践的主要内容,如果未能解决你的问题,请参考以下文章