怎么设置不让搜索引擎收录某些页面

Posted xingfudexu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了怎么设置不让搜索引擎收录某些页面相关的知识,希望对你有一定的参考价值。

一、关于robots文件

    1. 搜索引擎蜘蛛访问网站时,会先查看网站根目录下有没有robots.txt文件,该文件用于指令搜索引擎禁止抓取网站某些内容或 允许抓取某些内容。注意:就算允许抓取所有内容,也要建一个空的robots.txt文件放在根目录下。

    2. 只有在需要禁止抓取某些内容时,robots.txt才有意义,如果该文件为空,就意味着允许搜索引擎抓取所有内容。

    3. 语法解释:

         最简单的robots文件:禁止搜所有搜索引擎抓取任何内容,写法为:

         User-agent:*             

         Disallow:/

        其中,User-agent用于指定规则适用于哪个蜘蛛。通配符*代表所有搜索引擎。如只适用于百度蜘蛛,则写为:User-agent:Baiduspider。谷歌蜘蛛:Googlebot.

                   Disallow告诉蜘蛛不要抓取某些文件。如 Disallow:/post/index.html,告诉蜘蛛禁止抓取Post文件夹下index.html文件。 Disallow后什么都不写,代表允许抓取一切页面。

二、关于meta robots标签

     1. 用于指令搜索引擎禁止索引本页内容。

     2. 语法解释:<meta name="robots" content="noindex,nofollow"> 意思是 禁止所有搜索引擎索引本页面,禁止跟踪本页面上的链接。

        noindex:告诉蜘蛛不要索引本页面。

        nofollow:告诉蜘蛛不要跟踪本页面上的链接。

        nosnippet:告诉蜘蛛怒要在搜索结果中显示说明文字。

        noarchive:告诉搜索引擎不要显示快照。

        noodp:告诉搜索引擎不要使用开放目录中的标题和说明。

以上是关于怎么设置不让搜索引擎收录某些页面的主要内容,如果未能解决你的问题,请参考以下文章

网站出现重复内容 百度收录重复页面怎么办

DISCUZ 论坛的搜索结果页会不会被搜索引擎收录?

SEO优化中404错误页面的设置和HTTP状态码说明

SEO禁用蜘蛛(爬虫)搜索收录网页(全)

怎样将discuz的动态页面生成HTML的静态页面,以便搜索引擎更好的收录我的网站呢?请高手多多指导!

请问下怎么样不让输入字体和后面那个背景搜索图片重复,可以给placeholder设置左边距吗