如何从 HTML 文件生成 HAR 文件?

Posted

技术标签:

【中文标题】如何从 HTML 文件生成 HAR 文件?【英文标题】:How to generate HAR file from an HTML file? 【发布时间】:2012-05-20 17:40:57 【问题描述】:

如果我使用 wget,并从 URL 获取 html 文件。如何从该 HTML 文件生成 HAR 文件。

    任何从 html 文件生成 har 文件的开源实现? 生成 HAR 文件后,我可以使用 harlib 从 HAR 文件中读取数据。

如果可能,请建议 C、C++ 或 Java 实现。

【问题讨论】:

【参考方案1】:

HAR 格式的主要目的是拥有一个标准的 HTTP 跟踪格式,许多工具都可以使用和分析。换句话说,它的初衷是并且主要是为了进行性能分析,而不是“归档”网页本身。

如果您获取带有wget 的页面,您将丢失 99% 的所有性能数据。要捕获必要的数据,您确实需要一个浏览器来执行请求、获取所有相关资源、保存所有计时器等。这将使您能够构建瀑布图等。

如果您需要在服务器上捕获此数据,则可以使用 pcap 捕获 TCP 跟踪,然后使用convert that to HAR,尽管您仍然需要一个真正解析 HTML 并请求所有子资源的客户端( pcap 只是在后台收听)。或者,您可以将浏览器路由到through a proxy,让它为您输出一个 HAR 文件。

最后但同样重要的是,您可以通过其调试界面驱动浏览器并以这种方式导出 HAR 文件。用于驱动 Firefox 的 Java 示例:https://github.com/Filirom1/browsermob-page-perf

【讨论】:

以上是关于如何从 HTML 文件生成 HAR 文件?的主要内容,如果未能解决你的问题,请参考以下文章

如何通过命令提示符从 HAR 文件生成 Gatling 模拟类

通过命令行工具从给定 url 生成 har 文件的详细过程

如何访问 JSON 格式的 .har 文件的数据?

有没有办法自动生成har文件? [关闭]

httprunner学习2-har2case录制生成脚本

如何在java中解析HAR文件