php [robots.txt解析器] robots.txt php解析器#php

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了php [robots.txt解析器] robots.txt php解析器#php相关的知识,希望对你有一定的参考价值。

<?php
/*
https://github.com/bopoda/robots-txt-parser
composer require bopoda/robots-txt-parser
*/
use RobotsTxtParser;

//parse robots.txt
$parser = new RobotsTxtParser(file_get_contents('http://example.com/robots.txt'));
var_dump($parser->getRules());

//validate URL, use the RobotsTxtValidator class
$validator = new RobotsTxtValidator($parser->getRules());

$url = '/';
$userAgent = 'MyAwesomeBot';

if ($validator->isUrlAllow($url, $userAgent)) {
    // Crawl the site URL and do nice stuff
}

以上是关于php [robots.txt解析器] robots.txt php解析器#php的主要内容,如果未能解决你的问题,请参考以下文章

SEO之robots.txt

Python robotsparser 模块不会加载“robots.txt”

如何告诉搜索引擎使用我更新的robots.txt文件?

WordPress默认自带的robots.txt文件设置在哪里

当我有 robots.txt 时,我应该删除元机器人(索引、关注)吗?

如何在 robots.txt Disallow 指令中转义 $?