如何从 HTML 文件生成 HAR 文件?
Posted
技术标签:
【中文标题】如何从 HTML 文件生成 HAR 文件?【英文标题】:How to generate HAR file from an HTML file? 【发布时间】:2012-05-20 17:40:57 【问题描述】:如果我使用 wget,并从 URL 获取 html 文件。如何从该 HTML 文件生成 HAR 文件。
-
任何从 html 文件生成 har 文件的开源实现?
生成 HAR 文件后,我可以使用 harlib 从 HAR 文件中读取数据。
如果可能,请建议 C、C++ 或 Java 实现。
【问题讨论】:
【参考方案1】:HAR 格式的主要目的是拥有一个标准的 HTTP 跟踪格式,许多工具都可以使用和分析。换句话说,它的初衷是并且主要是为了进行性能分析,而不是“归档”网页本身。
如果您获取带有wget
的页面,您将丢失 99% 的所有性能数据。要捕获必要的数据,您确实需要一个浏览器来执行请求、获取所有相关资源、保存所有计时器等。这将使您能够构建瀑布图等。
如果您需要在服务器上捕获此数据,则可以使用 pcap 捕获 TCP 跟踪,然后使用convert that to HAR,尽管您仍然需要一个真正解析 HTML 并请求所有子资源的客户端( pcap 只是在后台收听)。或者,您可以将浏览器路由到through a proxy,让它为您输出一个 HAR 文件。
最后但同样重要的是,您可以通过其调试界面驱动浏览器并以这种方式导出 HAR 文件。用于驱动 Firefox 的 Java 示例:https://github.com/Filirom1/browsermob-page-perf
【讨论】:
以上是关于如何从 HTML 文件生成 HAR 文件?的主要内容,如果未能解决你的问题,请参考以下文章