PHP爬虫框架Beanbun使用

Posted liuzhiqaingxyz

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了PHP爬虫框架Beanbun使用相关的知识,希望对你有一定的参考价值。

第一 下载安装Beanbun框架

例如:

mkdir -p BeanbunTest
composer require kiddyu/beanbun

如图所示:

技术分享图片

 

第二 简单下载网页的例子

<?php
require_once(__DIR__ . ‘/vendor/autoload.php‘);

use Beanbun\\Beanbun;
$beanbun = new Beanbun;
$beanbun->seed = [
    ‘http://www.950d.com/‘,
    ‘http://www.950d.com/list-1.html‘,
    ‘http://www.950d.com/list-2.html‘,
];
$beanbun->afterDownloadPage = function($beanbun) {
    file_put_contents(__DIR__ . ‘/‘ . md5($beanbun->url), $beanbun->page);
};
$beanbun->start();

注意:可以以普通模式运行和以守护模式运行;

若以普通模式运行,则直接使用命令 php start.php即可,程序顺序执行,程序运行完成则自动结束

若依守护模式运行,则只能在linux操作系统中执行;开始使用php start.php start .结束使用命令php start.php stop .清除日志使用 php start.php clean

以上是关于PHP爬虫框架Beanbun使用的主要内容,如果未能解决你的问题,请参考以下文章

scrapy按顺序启动多个爬虫代码片段(python3)

scrapy主动退出爬虫的代码片段(python3)

十分钟就能快速上手的PHP爬虫框架

PHP爬虫最全总结2-phpQuery,PHPcrawer,snoopy框架中文介绍

PHP爬虫技术知识点总结

php爬虫框架盘点