用于“生成的源代码”的 PHP 简单 HTML DOM 解析器

Posted

技术标签:

【中文标题】用于“生成的源代码”的 PHP 简单 HTML DOM 解析器【英文标题】:PHP Simple HTML DOM Parser for "Generated Source Code" 【发布时间】:2014-05-28 06:55:52 【问题描述】:

据我了解,源代码有两种类型(Generated Source code VS Source Code 每页(如此处所述What is the difference between "Source" and "Generated Source"?)。

当我使用 php Simple html DOM Parser (http://simplehtmldom.sourceforge.net/) 时,我注意到我只能得到 Source Code

如何获得Generated Source code

如果无法使用 PHP Simple HTML DOM Parser ,是否有其他方法使用 PHP 来获取 Generated Source code? (可选)

如果无法使用 PHP 获取Gebnerated Source code,是否还有其他方法可以使用 javascript 获取它? (可选)

更新1:参考用户Shankar Damodaran的回答,我需要改变我的理解,源代码有以下三种类型:

实际源代码(例如 PHP、ASPX。通常适用于服务器端脚本)

源码(应用javascript和css之前的源码)

Generated Source Code(应用javascript和css后的源代码)

【问题讨论】:

根据您的更新 #1,您是在“源代码”还是“生成的源代码”之后? 【参考方案1】:

您不能单独通过 PHP,您必须依赖 Selenium 或 Phantom.js,它们是 无头浏览器,它们将呈现页面并返回您正在查看的 HTML 结构为。

【讨论】:

您还可以在这里找到更多其他工具***.com/a/125256/1189040【参考方案2】:

我想你误会了..

Source Code 由服务器解释 Generated Source Code 是返回给浏览器。 (只是 HTML 的东西

HTML DOM 解析器的作用是使用生成的源代码,而不是使用实际的源代码

回答您的问题...

如何获得生成的源代码?

您无法获得实际源代码,除非通过非法手段。

【讨论】:

我认为他指的是 HTML 源而不是另一个源代码,他指的是运行 JavaScript 等后的页面。 是的,就是客户端应用初始化后的 html 响应与 DOM。

以上是关于用于“生成的源代码”的 PHP 简单 HTML DOM 解析器的主要内容,如果未能解决你的问题,请参考以下文章

何时使用 index.php 而不是 index.html

Php 输出语句

做网页必须要用PHP和js吗

2016/05/23 thinkphp M方法和D方法的区别

PHP 表单处理

php define和const