白皮书解读搜索引擎的工作原理如何排序
Posted 迅步
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了白皮书解读搜索引擎的工作原理如何排序相关的知识,希望对你有一定的参考价值。
导读:搜索引擎是如何对网站进行排序的呢?今天解读的是索引。
搜索引擎工作过程包括:抓取——存储——页面分析——索引——检索。我们时常听到这样一个观点,先有收录,后有索引,或者先有索引,后有收录,根据我的研究经过反复数据演算,先有收录,后有索引是有一定依据的,比如一篇文章,site有索引结果,但输入url又没有搜索结果,那么这个是典型的有收录没有索引,没有索引意味着没有参与排名。
检索系统主要分为5个部分,我们这里就拿个例子,比如“10号线地铁故障”,那么百度分词的结果如下:
求交过滤后,能满足用户需求结果排序的就是文章1、文章2、文章4,也就是说,用户查找10号线地铁故障一词,展现出来的就是文章1、2、4。
那么最终排序取决于网站评级、主体内容质量、相关度、时效性等。
那么我们在做搜索引擎优化的时候,就知道怎么去撰写文章标题和文章内容了。也就是说,我们的内容尽可能都包含标题分词后的关键词。
1、相关性(主关键词数量以及相关词和外链指向锚文本)
5、丰富度(文字、图文、视频搭配或满足90%用户需求)
这里只提2方面,一个是相关性占据排序70%。另外一个满足90%用户需求,这里我举个例子,
比如搜索“感冒了怎么办”,那么搜索结果是感冒出现的症状、感冒出现每个症状应该怎么做和后续注意事项等等,这些结果覆盖越多,越能满足用户需求。
另外排序是搜索引擎引用机器学习,让程序自动计算公式,非人工参与。
以上是关于白皮书解读搜索引擎的工作原理如何排序的主要内容,如果未能解决你的问题,请参考以下文章
搜索引擎原理
详细解读SpringMVC工作原理,附加视频教程!
了解搜索引擎的工作原理是什么
SSL/TLS协议原理解读
ForkJoinPool线程池工作原理
深入解读国内首个容器技术白皮书