我想知道谷歌搜索引擎如何立即挑选结果

Posted

技术标签:

【中文标题】我想知道谷歌搜索引擎如何立即挑选结果【英文标题】:i wonderd how google search engine pick results with no time 【发布时间】:2011-06-17 09:53:03 【问题描述】:

谁能告诉谷歌如何在没有时间(80 毫秒到 100 毫秒)的情况下挑选搜索结果。

如果 mysql 中有包含 30lakes 行的数据,我会使用 mysql 作为我的数据库,即使它有正确的索引和引用,它也需要更多时间来加载。

谁能解释一下谷歌搜索引擎的工作原理。

提前致谢。

【问题讨论】:

他们有一些超棒的服务器^^。 嗨,尽管回答你的问题已经很晚了,但我找到了一个解释谷歌搜索如何工作的网站...这是链接...google.co.in/insidesearch/howsearchworks/thestory 【参考方案1】:

这可能对你有帮助

http://www.googleguide.com/google_works.html  

【讨论】:

【参考方案2】:

阅读原始文件,The Anatomy of a Large-Scale Hypertextual Web Search Engine。

在本文中,我们介绍了 Google,这是一个大规模搜索引擎的原型,它大量使用了超文本中存在的结构。 Google 旨在有效地抓取和索引 Web,并产生比现有系统更令人满意的搜索结果。具有至少 2400 万页的全文和超链接数据库的原型可在http://google.stanford.edu/获得。

设计搜索引擎是一项具有挑战性的任务。搜索引擎索引数以千万计的网页,这些网页涉及相当数量的不同术语。他们每天回答数以千万计的查询。尽管网络上的大型搜索引擎很重要,但对其进行的学术研究却很少。此外,由于技术的快速进步和网络的普及,今天创建网络搜索引擎与三年前有很大不同。这篇论文对我们的大型网络搜索引擎进行了深入的描述——迄今为止我们所知道的第一个如此详细的公开描述。

除了将传统搜索技术扩展到如此庞大的数据的问题之外,使用超文本中存在的附加信息来产生更好的搜索结果还涉及新的技术挑战。本文解决了如何构建一个可以利用超文本中存在的附加信息的实用大规模系统的问题。我们还研究了如何有效处理不受控制的超文本集合,任何人都可以发布他们想要的任何内容。

显然从那时起已经走了很长一段路,但这应该给你一个开始:)

【讨论】:

【参考方案3】:

以下是 Google 服务器结构的(粗略)概述:

http://www.googleguide.com/google_works.html

简而言之,Google 在后端没有一个 MySQL 服务器,而是多个不同(通用和专有)系统的服务器。

【讨论】:

【参考方案4】:

Google 在一个国家/地区拥有大约 1000 台服务器。当您按下回车键时,查询将发送到尽可能多的服务器,然后它们都会搜索一定数量的搜索数据库,然后将它们的结果放在一起并将它们发送到您的计算机。

更多信息可在名为Google 故事 的书中找到。我现在手头没有,所以找不到作者。

广告@m

【讨论】:

以上是关于我想知道谷歌搜索引擎如何立即挑选结果的主要内容,如果未能解决你的问题,请参考以下文章

谷歌搜索结果站点地图?

如何在 Python 中下载谷歌图片搜索结果

如何列出谷歌搜索结果中的所有页面?

如何在 Google 搜索结果页面中嵌入 iframe

如何使用谷歌地图仅在显示的地图内搜索?

从谷歌搜索中提取结果数量