php爬虫 phpspider

Posted brady-wang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了php爬虫 phpspider相关的知识,希望对你有一定的参考价值。

<?php
/**
 * Created by PhpStorm.
 * User: brady
 * Date: 2016/12/9
 * Time: 17:32
 */
ini_set("memory_limit", "1024M");
require dirname(__FILE__).‘/../core/init.php‘;

$url = "http://www.epooll.com/archives/806/";
$html = requests::get($url);
// 抽取文章标题
$selector = "//*[@id=\"content\"]/div[1]/div[1]/h1/a";

$title = selector::select($html, $selector);
// 检查是否抽取到标题
// 抽取文章作者
$selector = "//*[@id=\"content\"]/div[1]/div[1]/h6/span[1]";
$author = selector::select($html, $selector);
// 检查是否抽取到作者
// 去掉 作者:
$author = str_replace("作者:", "", $author);
//发布时间
$selector = "//*[@id=\"content\"]/div[1]/div[1]/h6/span[2]";
$time = selector::select($html, $selector);
$time = str_replace("发布时间:",‘‘, $time);
$time  = date("Y-m-d H:i:s",strtotime($time));
// 抽取文章内容
$selector = "//*[@id=\"content\"]/div[1]/div[2]";
$content = selector::select($html, $selector);
// 检查是否抽取到内容
$data = array(
    ‘article_title‘ => $title,
    ‘article_author‘ => $author,
    ‘article_content‘ => $content,
);
// 查看数据是否正常
$res = db::insert("content", $data);
var_dump($res);

  

以上是关于php爬虫 phpspider的主要内容,如果未能解决你的问题,请参考以下文章

php爬虫 phpspider

phpspider php爬虫框架

十分钟就能快速上手的PHP爬虫框架

php爬虫

phpspider案例

scrapy按顺序启动多个爬虫代码片段(python3)