搜索引擎的原理你知道吗?

Posted 一站式全网营销

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了搜索引擎的原理你知道吗?相关的知识,希望对你有一定的参考价值。

      当下主要的搜索引擎有以下几家:360、百度、谷歌、搜狗等等,他们的工作原理你都知道吗?其实搜索引擎的工作原理很简单,分为以下几个部分:

一、爬行

    这个可以理解为正在网上爬行的小动物,它通过特定规律的代码,对网页的链接进行跟踪,如此依次进行,从一个链接爬到另外一个。“小动物”是一组代码程序,它可以自己爬行。从大量发信息数据中,按照一定的规则收集网站上面的内容,最终将结果提交反馈给抓取的程序。


二、抓取

    抓取是将“小动物”所收到的信息进行初步的检测与分类,把其中有效的信息、用户强烈关注的信息、合法的信息等等进行保留。并存放到数据库容器里面通过下一步的收录程序进行进一步的严格审核。


三、收录

       把通过一、二步的信息进行比对,然后逐条判断,把符合规则的内容放到索引数据库中,从而方便建立索引。这样就很大程度的提高了用户的搜索效率。并且这个页面的内容也在索引数据库中收录成功了。


四、排名

      根据用户进行搜索的关键词给出排名,计算的方式是:对搜索的词进行处理;对照数据库里进行匹配;初始的数据选择;相关性的计算;以及过滤调整到最后的排名。 

               

以上是关于搜索引擎的原理你知道吗?的主要内容,如果未能解决你的问题,请参考以下文章

突击Java面试-分布式搜索引擎的架构原理

es 的分布式架构原理

搜索引擎工作原理

我所了解的搜索引擎工作原理

ES 的分布式架构原理能说一下么?

都说优化,你知道1688搜索引擎考核的指标是什么吗?