QueryList官方文档:https://www.querylist.cc/docs/guide/v3
因为php版本使用5.6,所以使用QueryList v3版本,php7可以使用 v4版本
v3版本
环境要求:PHP >= 5.3
composer 安装:
composer require jaeger/querylist:V3.2.1
安装后会生成一个目录:vendor
案例
<?php
//引入QueryList
require \'vendor/autoload.php\';
use QL\\QueryList;
//待采集的页面地址
$url = \'https://www.cnbeta.com/\';
//分析页面结构,制定采集规则,爬取数据
//采集规则
$rules = [
//文章标题
\'title\' => [\'a:eq(0)\',\'text\'],
//文章链接地址
\'link\' => [\'a:eq(0)\',\'href\'],
//文章缩略图
\'img\' => [\'img:eq(0)\',\'src\'],
//文章简介
\'summary\' => [\'p:eq(0)\',\'text\']
];
//切片选择器
$range = \'.items-area>.item\';
$data = QueryList::Query($url,$rules,$range)->data;
echo \'<pre>\';
print_r($data);
爬取结果