PHP - 如何解析HTML文件

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了PHP - 如何解析HTML文件相关的知识,希望对你有一定的参考价值。

有一个开源的php库“PHP Simple html DOM Parser”,其官方网址为http://simplehtmldom.sourceforge.net/,它可以将HTML文件解析为DOM模型,并且其查找DOM对象的语法类似jQuery,使用很方便,具体用法到官网看帮助。

对于中文网页,如果编码不是UTF-8的,则需要采用如下代码转换:

$info = file_get_contents("http://www.siluke.com/0/78/78773/");

$info = iconv("gbk", "utf-8//IGNORE", $info);

$dom = str_get_html($info);

就是先用file_get_contents()得到页面内容,再用iconv()转换编码,最后用str_get_html()生成DOM树。

以上是关于PHP - 如何解析HTML文件的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 CURL 解析 html 文件中的内容? [关闭]

将HTML文件解析为PHP

apache禁止解析php文件

如何在 PHP 中解析 CSV 文件

如何使用 PHP 解析 JSON 文件? [复制]

如何在php中上传和解析CSV文件