PHP 使用PHP5和XPath轻松进行抓取和HTML解析

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了PHP 使用PHP5和XPath轻松进行抓取和HTML解析相关的知识,希望对你有一定的参考价值。

<?php
//a URL you want to retrieve
$my_url = 'http://www.digg.com';
$html = file_get_contents($my_url);
$dom = new DOMDocument();
$dom->loadHTML($html);
$xpath = new DOMXPath($dom);

//Put your XPath Query here
$my_xpath_query = "/html/body/div[@id='container']/div[@id='contents']/div[@class='list' and @id='wrapper']/div[@class='main' and position()=1]/div[contains(@class, 'news-summary')]/div[@class='news-body']/h3";
$result_rows = $xpath->query($my_xpath_query);

//here we loop through our results (a DOMDocument Object)
foreach ($result_rows as $result_object){
	echo $result_object->childNodes->item(0)->nodeValue;
}
?>

以上是关于PHP 使用PHP5和XPath轻松进行抓取和HTML解析的主要内容,如果未能解决你的问题,请参考以下文章

尝试使用 BeautifulSoup 从我的代码中使用 Xpath 进行网络抓取 [重复]

PHP与apache版本配对

Php5.5新特性 Generators详解

在 ubuntu 上使用 nginx 和 php5-fpm 进行配置帮助

使用 selenium 和 bs4 进行网页抓取

Python lxml包下面的xpath基本用法