将 HTML 另存为独立页面:导出工具?

Posted

技术标签:

【中文标题】将 HTML 另存为独立页面:导出工具?【英文标题】:Save HTML As Standalone Page: Exporting Tool? 【发布时间】:2014-08-25 10:27:42 【问题描述】:

我需要定期将 html 页面作为独立的 .html 文件发送给客户端,没有外部依赖项。原始页面是用 node.js 和 express 完成的,它们包含几个库,例如 High Charts。 到目前为止,我已经手动完成了准备工作,其中包括:

将所有图像转换为 blob 复制页面内的所有外部.js和.cs 尽可能减少(标准库,如 jQuery 或 Bootstrap...)

结果是一个 .html 文件,可以在没有互联网连接的情况下打开,看起来就像原始文件一样。

是否有任何工具可以自动执行此操作?如果没有,也许我会自己用 Python 编写代码。您对此有什么建议吗?

谢谢

【问题讨论】:

你真的在你的页面中嵌入了这样的东西吗?而且你不必冒犯。我只是在寻找您的问题的解决方案!如果您已经知道答案,为什么要在这里问他们。并尝试像这样将更大的图像嵌入到您的 html 中并查看结果;) 你是对的。看我需要发送一个具有所有功能的文本文件。我知道如何手动完成,我只是在自己编写代码之前寻找一种自动工具。干杯 【参考方案1】:

Monolith 是一个 CLI 工具,用于将完整的网页保存为单个 HTML 文件

见https://github.com/Y2Z/monolith

【讨论】:

【参考方案2】:

向 OP 道歉,因为这个答案对他来说可能为时已晚,但我发布它是为了帮助有类似问题的任何人:

HTTrack 是一个开源项目,几乎完全符合您的描述,尽管它在一些更奇特的 JS 上不能完美运行。

它保存了包含大部分 JS 的页面、主要图像以及页面需要完整显示的所有内容。它可以配置为包含或排除整个或部分 JS、图像和 CSS。

这不会将所有 JS 和其他内容导入 HTML 文件,而是将所有内容整齐地组织到一个文件夹中,并更正所有路径以使文件夹可移植。

获取一些受保护的外部资源似乎也有问题,但如果它是您的本地站点并且只使用 JQuery 等常用脚本,您应该没问题。当我测试它时,它正确地下载了我所有的本地 CSS 和我合并的任何有效的外部 CSS 库、我正在使用的 JQuery 和衍生脚本以及嵌入的图像。

只是为了给大家省一个问题,程序默认将下载的网站保存到C:\My Web Sites

【讨论】:

以上是关于将 HTML 另存为独立页面:导出工具?的主要内容,如果未能解决你的问题,请参考以下文章

通过显示“另存为对话”导出文件

下载 aspx 页面并将其另存为 HTML 页面 [关闭]

Python Pandas Dataframe 另存为 HTML 页面

将打开的网页另存为 HTML 文件

java怎么实现把页面的表格另存为一个word文档,求各位大神指导

excel怎么转为pdf