用于“生成的源代码”的 PHP 简单 HTML DOM 解析器
Posted
技术标签:
【中文标题】用于“生成的源代码”的 PHP 简单 HTML DOM 解析器【英文标题】:PHP Simple HTML DOM Parser for "Generated Source Code" 【发布时间】:2014-05-28 06:55:52 【问题描述】:据我了解,源代码有两种类型(Generated Source code
VS Source Code
每页(如此处所述What is the difference between "Source" and "Generated Source"?)。
当我使用 php Simple html DOM Parser (http://simplehtmldom.sourceforge.net/) 时,我注意到我只能得到 Source Code
。
如何获得Generated Source code
?
如果无法使用 PHP Simple HTML DOM Parser ,是否有其他方法使用 PHP 来获取 Generated Source code
? (可选)
如果无法使用 PHP 获取Gebnerated Source code
,是否还有其他方法可以使用 javascript 获取它? (可选)
更新1:参考用户Shankar Damodaran
的回答,我需要改变我的理解,源代码有以下三种类型:
实际源代码(例如 PHP、ASPX。通常适用于服务器端脚本)
源码(应用javascript和css之前的源码)
Generated Source Code(应用javascript和css后的源代码)
【问题讨论】:
根据您的更新 #1,您是在“源代码”还是“生成的源代码”之后? 【参考方案1】:您不能单独通过 PHP,您必须依赖 Selenium 或 Phantom.js,它们是 无头浏览器,它们将呈现页面并返回您正在查看的 HTML 结构为。
【讨论】:
您还可以在这里找到更多其他工具***.com/a/125256/1189040【参考方案2】:我想你误会了..
Source Code 由服务器解释 Generated Source Code 是返回给浏览器。 (只是 HTML 的东西)
HTML DOM 解析器的作用是使用生成的源代码,而不是使用实际的源代码。
回答您的问题...
如何获得生成的源代码?
您无法获得实际源代码,除非通过非法手段。
【讨论】:
我认为他指的是 HTML 源而不是另一个源代码,他指的是运行 JavaScript 等后的页面。 是的,就是客户端应用初始化后的 html 响应与 DOM。以上是关于用于“生成的源代码”的 PHP 简单 HTML DOM 解析器的主要内容,如果未能解决你的问题,请参考以下文章