Solr 和网站索引以创建网站搜索
Posted
技术标签:
【中文标题】Solr 和网站索引以创建网站搜索【英文标题】:Solr and web site indexing to create a site search 【发布时间】:2011-01-29 16:14:26 【问题描述】:我试图在一个简单的 http 站点上构建“站点搜索”。
我有一个网站,我们称之为 www.mycompany.com,它是纯 html。
有没有一种简单的方法可以使用 solr 来索引整个站点以使用 solr 作为引擎来构建全文搜索?
我用谷歌搜索了一下,找不到任何特定类型的东西: 做一个 做B ... 利润!
如果我对什么是 solr 有点不理解,请告诉我:P
提前致谢。
【问题讨论】:
【参考方案1】:$ bin/solr create -c corename
$ bin/post -c corename https://siteurl.com -recursive 2 -delay 1
这会做一个网站的基本索引,但它不是最好的。如果你想要简单,那么它就在那里。可以的。
我认为这只适用于 solr 5+。
【讨论】:
【参考方案2】:Solr 仅用于索引和搜索文本,它没有爬虫,因为它超出了项目的范围。
不过看看Nutch,它是一个爬虫,最初设置起来并不难。
Nutch 和 Solr can be integrated 如果您需要一些特定于 Solr 的功能来搜索索引。
【讨论】:
我没有得到的一件事是他们正在使用谷歌网站搜索来搜索nutch.apache.org 网站。【参考方案3】:您可能想要查看的另外两个选项是 Crawl Anywhere 和 Heritrix
【讨论】:
以上是关于Solr 和网站索引以创建网站搜索的主要内容,如果未能解决你的问题,请参考以下文章