PHP 之simple_html_dom实现网页数据采集

Posted 样子2018

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了PHP 之simple_html_dom实现网页数据采集相关的知识,希望对你有一定的参考价值。

<?php
    set_time_limit(0);
    include \'./simple_html_dom.php\';
    $url = \'https://price.pcauto.com.cn/price/rank/nb1-lb0-o1/\';
    $html = file_get_html($url);
    $list = $html->find("#JlistTb .j-list");
    $id = array();
    $title = array();
    $price = array();
    $dealer_price = array();
    $pic = array();
    for ($i=0; $i < count($list); $i++) { 
        $idText = $html->find("#JlistTb .j-list dd[name=dealer_price]", $i)->id;
        $id[] = explode("_", $idText)[2];
        $title[] = $html->find("#JlistTb .j-list .sname", $i)->innertext;
        $price[] = $html->find("#JlistTb .j-list .pri", $i)->innertext;
        $dealer_price[] = $html->find("#JlistTb .j-list .emphs", $i)->innertext;
        $pic[] = "https:".$html->find("#JlistTb .j-list .pic img", $i)->getAttribute("#src");
    }
    $list = array();
    for ($i=0; $i < count($title); $i++) { 
        $list[$i] = array(
            \'id\' => $id[$i],
            \'title\' => $title[$i],
            \'price\' => $price[$i],
            \'dealer_price\' => $dealer_price[$i],
            \'pic\' => $pic[$i],
            \'area_id\' => 1
        );
    }
    var_dump($list);
?>

数组打印结果为

参考文档:https://github.com/yangsphp/simple_html_dom-master

以上是关于PHP 之simple_html_dom实现网页数据采集的主要内容,如果未能解决你的问题,请参考以下文章

php解析html类库simple_html_dom

五环之歌之PHP分页

php解析html类库simple_html_dom

php利用simple_html_dom类,获取页面内容,充当爬虫角色

爬虫之蜂鸟网图片爬取

求php数字分页算法