Solr 和网站索引以创建网站搜索

Posted

技术标签:

【中文标题】Solr 和网站索引以创建网站搜索【英文标题】:Solr and web site indexing to create a site search 【发布时间】:2011-01-29 16:14:26 【问题描述】:

我试图在一个简单的 http 站点上构建“站点搜索”。

我有一个网站,我们称之为 www.mycompany.com,它是纯 html

有没有一种简单的方法可以使用 solr 来索引整个站点以使用 solr 作为引擎来构建全文搜索?

我用谷歌搜索了一下,找不到任何特定类型的东西: 做一个 做B ... 利润!

如果我对什么是 solr 有点不理解,请告诉我:P

提前致谢。

【问题讨论】:

【参考方案1】:
$ bin/solr create -c corename
$ bin/post -c corename https://siteurl.com -recursive 2 -delay 1

这会做一个网站的基本索引,但它不是最好的。如果你想要简单,那么它就在那里。可以的。

我认为这只适用于 solr 5+。

【讨论】:

【参考方案2】:

Solr 仅用于索引和搜索文本,它没有爬虫,因为它超出了项目的范围。

不过看看Nutch,它是一个爬虫,最初设置起来并不难。

Nutch 和 Solr can be integrated 如果您需要一些特定于 Solr 的功能来搜索索引。

【讨论】:

我没有得到的一件事是他们正在使用谷歌网站搜索来搜索nutch.apache.org 网站。【参考方案3】:

您可能想要查看的另外两个选项是 Crawl Anywhere 和 Heritrix

【讨论】:

以上是关于Solr 和网站索引以创建网站搜索的主要内容,如果未能解决你的问题,请参考以下文章

solr组件的角色都有哪些

#私藏项目实操分享# SAP Commerce Cloud 里的 Solr 架构简介

solr 在哪里存储搜索索引,在数据库中还是在文件中?

处理 Solr 读写超时异常

搜索技术---solr

Symfony2 中的搜索框与 Solr