SEO干货之百度中文分词技术详解

Posted 明美无限

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SEO干货之百度中文分词技术详解相关的知识,希望对你有一定的参考价值。

分词技术是搜索引擎对用户提交的关键词进行处理以后,根据用户的关键词串进行匹配的一种技术。虽然谷歌是这种技术的创始者,但由于中文比英文复杂得多,所以中文分词这方面还是百度领先。


中文分词有三种方法:字符串匹配的分词法、词义分词法以及统计分词法。


这里概念就不介绍了,我们直接分析案例。我们以“上海网站建设”作为例子,假如这就是你网站的关键词:


SEO干货之百度中文分词技术详解


这个关键词用字符串匹配的分词是“上海网站建设”,词义分词是“上海网站”、“网站建设”,统计分词是“上海”、“网站”、“建设”。一个词分成这么多个,百度还会按照这些分词词语的匹配、词义的匹配、词语出现的频率,最后决定根据哪些词语捕捉网页。


话不多说,我们在百度输入“上海网站建设”,从搜索结果我们可以看到,除去广告,排名第一的网站红色的关键词大体都是“上海网站建设”以及其分词:


SEO干货之百度中文分词技术详解


这里有人可能会奇怪,有些网站词义不太相近位置也很靠前,比如:


SEO干货之百度中文分词技术详解


这主要是因为除去标题意思相近,文章的被关注率,网站主题,网站的外链及权重也是决定其排名的因素。但是这和我们的主题无关就不多介绍了。


然后我们再用百度快照来看一下



你能看到“上海网站建设”被标黄,这是百度给的权重。其中黄色>蓝色>绿色,这里我们看到的全部是黄色,这也就是为什么该网站排名靠前的原因。


所以以这个内容为例,我们最优先考虑的关键词应当是“上海网站建设”以及“上海”,然后再考虑“上海网站”,再考虑“网站建设”。因为“建设“这个内容太宽泛可能与行业无关,我们就不予考虑了。


通过中文分词技术,再熟悉网民搜索的习惯,我们将更容易为我们的网站确定关键词,在提升网站排名上如鱼得水。

明美无限

互联网营销推广致力者,自媒体人,知乎专栏作者


以上是关于SEO干货之百度中文分词技术详解的主要内容,如果未能解决你的问题,请参考以下文章

百度中文分词技术是什么?

SEO算法:中文分词技术原理与应用!

百度搜索的中文分词方法详解

什么是搜索引擎分词技术?

php提取关键字中文分词

自然语言处理之中文分词器-jieba分词器详解及python实战