nginx下禁止访问robots.txt的设置方法

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了nginx下禁止访问robots.txt的设置方法相关的知识,希望对你有一定的参考价值。

关于robots.txt文件:搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信 息。您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot 访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。

访问,可以得知我们网站中存在/admin和/bbs,其中/admin是关于后台管理的目录,把这个路径轻易的暴漏显然是不太安全的,下面我们可以通过禁止访问.txt类型的文件来,增加网站的安全性


修改nginx.conf文件,vim /usr/local/nginx/conf/nginx.conf

location ~* \.(txt|doc)$ {  
            root   /usr/local/nginx/html;  
            deny all;  
    }

指定403.html文件的配置信息

location ~* \.(txt|doc)$ {  
            root   /usr/local/nginx/html;  
            deny all;  
    }

重新加载配置文件

/usr/local/nginx/sbin/nginx -s reload

再次访问,发现提示无法访问该文件了。

本文出自 “王森” 博客,请务必保留此出处http://zhibeiwang.blog.51cto.com/7555525/1857416

以上是关于nginx下禁止访问robots.txt的设置方法的主要内容,如果未能解决你的问题,请参考以下文章

IIS设置文件 Robots.txt 禁止爬虫

怎么设置不让搜索引擎收录某些页面

2022 最新Robots.txt文件教程

如何使用robots禁止各大搜索引擎爬虫爬取网站

Nginx:备用域的不同 robots.txt

Nginx 块 robots.txt 文件