搜索引擎优化与本地化——网页内SEO与URL
Posted T君的本地化日常
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了搜索引擎优化与本地化——网页内SEO与URL相关的知识,希望对你有一定的参考价值。
前言
在上一篇文章中T君入门式介绍了搜索引擎优化(SEO)的知识,大家可以戳这个链接复习一下:
本篇文章将继续介绍SEO的实际操作,有关网页内容编排与网站开发。这一篇文章可能会涉及更多的术语,不过T君仍然会尽力用plain language讲明白。
本文主要出于科普目的,所有信息均系互联网信息搜集、汇总、筛选、编写,倘若有任何错误,敬请大家后台留言指出。谢谢大家的支持。
3 网页内SEO (On-page SEO)
在完成关键词调研后,就到了SEO的实践环节——网页内SEO (On-page SEO)。On-page SEO要从网页内容与网站搭建两方面入手。本章节首先着重介绍内容优化,后面再介绍技术层面的优化。
On-page SEO 需要将关键词、对应内容、对应用户行为(2.2所述)进行归类。同时回答以下几个问题:
网页内的视频与图片多吗?
网页内容是长篇还是短篇?
网页是用列表、要点、分段呈现的吗?
如何优化我的网页才能让它获得比竞争对手更高的排名?
3.1 SEO为用户服务,而不是排名
网页内容应当落脚到“更好地回应用户搜索时的需求”,而非一昧地“获取更高的排名”。内容应当为互联网用户服务,而不是搜索引擎的排名算法。有几种内容编排策略是SEO应当避免的。
3.1.1 内容单薄
一种过时的内容编排策略是为某一关键词下的派生词/词组创建不同的页面,靠“人海战术”挤兑其它网站以获取更高的排名。
例如礼服租赁网站,为 “婚庆礼服”、“婚礼礼服”、“婚宴礼服”各自创建单独的页面,而这三个关键词对应的网页内容几乎一样。相似的策略也用于实体店,例如某咖啡店为“五道口分店”、“望京分店”、“西单分店”各自创建了单独的宣传网页,而页面内容除了地理位置之外都完全一样。
早期的搜索引擎并不聪明,没有办法判断词句之间的关系。所以当搜索引擎遇到“婚礼婚纱”和“婚宴婚纱”时,会把它们当作不同的东西。直到2011年,谷歌推出了代号为Panda的算法,能够检测出采用这种策略的低质量网页内容并降低其排名,有效地化解了这一现象,使得真正高质量的网页排名上升。
3.1.2 内容重复
内容重复指的是某站点内部多个网页或者多个站点之间使用高度相似(几乎一样)的内容。更恶劣的“内容重复”行为指某些网站在未经授权的情况下窃取其它网站的内容,对内容不加修改或进行篡改(例如替换人名、地名)并发布于其它平台。
谷歌鼓励开发者使用rel=canonical 标签以标识网站内容的原始版本,进而避免雷同内容反复出现。谷歌检测到雷同内容并不会降低其排名,而是依据rel=canonical标签保留原始内容,过滤掉重复内容;换言之,具有雷同内容网页会被隐藏,进而保障用户的使用体验(好家伙这比降低排名更狠了吧)。
3.1.3 内容伪装
搜索引擎老大哥给各网站立下的规矩之一是:爬虫获取的内容必须得是用户可以看见的。也就是网站理论上不能将内容隐藏于html代码当中,让某些内容对用户隐形但是搜索引擎却能检测到。
不过规矩就是为了让人打破的,网站这么做就称为“内容伪装“(cloaking)。开发者可以通过很多方法实现网页内容伪装,而这么做的原因也有好有坏。搜索引擎检测到这种行为也并不一定将其过滤,因为有的内容伪装能为用户提供好的使用体验,
国外知名音乐网站Spotify就用过这种手段:将登录界面附上用户不可见的歌曲/专辑/歌手信息,让搜索引擎误以为这是含有实质内容的网页,这样用户搜索相关乐曲时点击进入了Spotify的登录页。(狡猾滴很)
3.1.4 堆砌关键词
总有人误以为在自家网页中塞满关键词就能让搜索引擎更加“重视”。虽然谷歌确实计算关键词及相关概念被提及次数,但最终能够让排名上升的还是用户的选择。疯狂堆砌关键词在很多案例下已经被证明只能降低用户的阅读效率。T君编一个例子:
北京城市服务:“宠物寄养”
——经验丰富的宠物寄养人
如果您正在寻找经验丰富的宠物寄养人,那您可是来对地儿了!本公司承接“宠物寄养”城市服务已有十余年历史,对各类犬种均具有丰富的宠物寄养知识。当代城市很多打工人都忙于996福报而无暇顾及自家的宠物抚养,但是您可以选择我们的宠物寄养服务!我们的宠物寄养城市服务值得信赖,全部五星好评!
你说读起来累不累。
3.1.5 自动生成内容
当下存在于互联网的低质量内容很多都是电脑生成的,不少网站用编程生成包含关键词的大串内容,但是对人类读者来说这些内容完全没有意义。谷歌对于自动生成内容的界定是:
对读者无意义的文本,但可能包含搜索关键字。
由自动工具翻译的文本,未经人工审核便发布
通过自动过程(例如马尔可夫链)生成的文本
使用自动同义词转换或混淆技术生成的文本
抓取Atom / RSS提要或搜索结果生成的文本
“缝合”来自不同网页的内容且内容实际价值没有增加
由于机器学习与AI技术发展,程序写出来的文字越来越近似人类创作,不少内容甚至具有清晰的含义,但该行为其本质上仍然是为了操纵搜索结果排名而进行的不正当手段。谷歌在Google’s quality guidelines当中指出此类行为都会作出处理。
3.2 正确的做法
SEO的正确策略是编写优质的内容服务于用户。一个简单的理念就是,如果我们能够将网页做的比现有搜索结果排名前十的要好,那么我们就可以取而代之。具体做法有点类似竞品分析:
搜索与自家产品相关的关键词
确定与这些关键词相关的网页
看看这些网页哪里做的好
把自家网页做的比它们还好
具体化的内容编写就需要实际案例分析,在此T君没有足够的知识储备来展开了。不过,写到这里的时候T君脑海中突然闪现出一个新兴工作岗位”用户体验文案”(UX Writer)。亚马逊、PayPal、谷歌都启动了这一工作岗位,而这一岗位的职责便是编写用户交互界面文案。编写这些文案的目的是充分照顾到用户的使用体验,增进用户对产品的好感度。这似乎跟SEO在内容方面的优化有异曲同工之妙,都是以用户体验为重。
当然,SEO除了内容方面的编写之外,还有内容之外的网页设计与开发。
3.3 内容之外——网页开发
文章进行到这里,介绍的内容都会和网页设计与开发有关,其中可能会涉及到一些术语。T君尽可能为大家解释清楚。
3.3.1 Header标签
HTML是编写网页用的“语言”。一个网页就是一个HTML文档,它由许多HTML元素构成。所谓元素,就是组成网页的代码,具有很多种类。
Header标签是HTML当中的一种元素,它定义了标题的文本与样式。主标题记作H1,副标题以及更低层次的标题用H2-H6表示。
<h1>Page Title</h1>
代码片段:可切换语言,无法单独设置文字格式
每个网页都应该有H1标题来描述页面的主题。H1标题应当包含页面的关键词/词组,尽量减少非必要信息;副标题(H2-H6)应当描述更具体内容。
3.3.2 站内链接
在上一篇文章中,T君提到爬虫在爬取页面信息时会沿着页面内其它URL跳转,就像织起来一张网。设计网页时要考虑到站内链接的连贯与完整性,方便爬虫索引站点内所有(需要被索引的)页面。
爬虫有时会忽视下拉菜单(因为它有时需要用户点击或移动鼠标至某处才会触发下拉动作),因此尽量为下拉菜单下面的链接提供多个入口。
锚文本(Anchor Text)链接是一种链接的展示形式。锚文本就是使用关键词作为链接,指向一个网页。与锚文本链接类似的是超链接,就是单纯的显示xxx.com这样的网址。锚文本能够提供关键词告诉搜索引擎,链接指向的网页内容与什么有关。
链接数量也是一个重要的考虑因素。谷歌给出的建议是将单一页面里面链接的数量限制在一个合理的水平(大约几千个)。过多的链接数量会影响搜索引擎的效率。此外,T君在1.1也提到过爬取预算(crawl budget)这一概念。总之,链接数量肯定不是多多益善。
3.3.3 图片优化
图片是拖慢网站加载速度的元凶之一。因此压缩图片使其保持“清晰”且不影响加载速度是上策。一般来说,如果需要用动图,图片选用GIF格式;如果不需要高分辨率图片,选用JPEG;如果需要高分辨率图片,就用PNG。Google's image optimization guide针对图片压缩率、格式选择、所需工具等方面都进行了详细讲解。
电商网站需要用到大量的缩略图(thumbnails),此类网站需要格外留意加载时间。
替代文本(alternative text, 又叫Alt 文本) 是网站无障碍规范之一。它是附在图片HTML代码内的描述性文字,目的是方便视障人士通过文本转语音工具了解图片内容。搜索引擎也会识别替代文本以理解图片。在编写替代文本时需要注意文本应当具备可读性。
3.3.4 内容格式
纵使我们内容写的很好,但如果因为“格式”不对胃口而导致正文内容可读性变差,可能失去用户的青睐,也就没有什么流量。在格式上应当注意:
文本字号与颜色:谷歌建议字号大于16,这样多数用户无需在移动设备上缩放便能看清;文本颜色的选取应当留意与网页背景/主题色相配。
标题:对于长篇文章,标题尤其重要,起到分割内容、点明要点的作用。
列表:符号列表、数字列表、多级列表,都有助于用户快速定位信息。
多媒体:适当穿插图像、视频等元素,避免阅读疲劳。
3.3.5 Title标签
Title标签用于定义文档的标题。
<head>
<title>SEO 101</title>
</head>
代码片段:可切换语言,无法单独设置文字格式
上述代码的作用是将网页的标题设置为“SEO 101”。而这就是搜索引擎会在结果页面展示的内容。
编写标题要注意的要素是:
关键词:在标题中加入目标关键词可以帮助用户和搜索引擎了解页面的内容。此外,关键词越靠近标题标签的前部,用户就越有可能阅读到它们(并点击),也就对排名也就越有帮助。
标题长度:搜索引擎一般会抓取50-60个字符,余下的会用省略号代替。
品牌名:品牌也算是一个关键词,可以放在title的开头或者末尾。
3.5.6 元描述
元描述(meta description)也叫描述标签,是对网站内容的一段描述,就像一篇论文的摘要。元描述会出现在搜索结果页面的各个结果title下方,长度控制在155-300个字符为佳。
<head>
<meta name=”description” content=”Description of page here.”/>
</head>
撰写元描述时也得注重内容与主题、正文内容、关键词的相关度。
4 统一资源定位符URL
与title标签和元描述一样,搜索引擎会在结果页面上显示URL。URL命名和格式会影响用户的点击率,而且URL也被搜索引擎用来对网页进行评估和排名。
长度:许多SEO研究表明,搜索者通常更喜欢较短的URL。就像title标签和元描述一样URL的过长部分也会被省略掉。但同时,URL的描述性也同样重要,所以不要为了刻意缩短URL长度而忽视URL所传递的信息量。
命名:明晰的URL命名能让用户简单理解网页对应的内容,例如”example.com/drink/mojito”要比“example.com/asdf/recipe2333”更能传递网页的内容概要。
同时避免过度使用参数、数字和符号,例如“example.com/recipe?id=2”。也不要在URL中使用大写字母,而应该全部使用小写字母。
部分web应用无法解析下划线(_), 加号或空格,因此尽量使用横线(-)来分隔URL当中的单词。
描述性:如果页面的主要内容与一个特定的关键词相关,尽量将其写入URL。然而不要为了纯粹SEO而试图在在URL中乱填充关键词。如果是本地实体经营,那URL中要尽量包含地理位置关键词。
协议:HTTP协议规定了网络服务器传输超文本到用户端的方法。后来科学家将HTTP升级为HTTPS (s代表“安全”)。HTTPS使用了数据加密技术,确保在网络服务器和本地浏览器之间传递的任何数据都是私密的。
2018年,谷歌Chrome浏览器将所有HTTP网站显示为“不安全”(Not Secure)。这可能会导致用户不信任HTTP网站,进而降低点击率。
结语:本篇文章主要为大家解释了SEO实际操作的一些方法,包括内容的撰写与网页开发设计时的注意事项。遗憾在于自身知识水平限制,没办法通过具体的案例讲接内容/文案的编写。
下一篇文章T君预计介绍如何将SEO融入本地化流程当中……还没写呢……能写出来最好……也可能,写不出来了哈哈哈哈。
以上是关于搜索引擎优化与本地化——网页内SEO与URL的主要内容,如果未能解决你的问题,请参考以下文章