从外部页面中提取元素的内容

Posted

技术标签:

【中文标题】从外部页面中提取元素的内容【英文标题】:Extracting the content of an element from an external page 【发布时间】:2012-01-10 06:57:46 【问题描述】:

我们引用的网站重建涉及我们获取当前网站,为其进行新设计,然后在 Business Catalyst(Adobe 的内容管理系统)中重建它。

不幸的是,当前网站从我假设的 mysql 表中获取信息(因为该网站是用 php 编写的),而 Business Catalyst 不支持使用服务器端语言。

有没有一种方法可以从网络上的远程页面中提取一段 html 并使用非服务器端脚本(可能使用 JQuery)将其显示在新网站上?

以下是我提出的一些建议以及它们在这种情况下不可行的原因:

    iFrame - 首先想到的是,但我不确定是否可以: 一种。为加载的 HTML 设置样式 湾。我要捕获的内容位于页面的中心 - 我不知道如何从该容器的左上角开始呈现 iFrame 的内容,而不是从页面本身的左上角开始。 将当前 MySQL 表的内容导出到 Excel,然后将其导入 Business Catalyst - 这被击落了,因为公司的计算机上有与数据库相关的库存管理软件,这意味着它被更新了 10一天几次。

任何建议都会很棒。


如果有人可以tag 这个问题对我来说更好,那将不胜感激,因为我遇到了一些麻烦。

【问题讨论】:

【参考方案1】:

您可以使用 jQuery 的load() 函数将来自外部页面(甚至是另一个页面上的特定 div)的内容加载到当前页面上的 div 中,如下所示:

$("#load_content_in_this_div").load("page.html #div_to_pull_from");

这将从page.html 上的#div_to_pull_from div 中提取的内容加载到当前页面上的#load_content_in_this_div div 中。

至于从另一个域的页面中提取内容,this 插件应该可以解决问题。

【讨论】:

以上是关于从外部页面中提取元素的内容的主要内容,如果未能解决你的问题,请参考以下文章

使用 C# 从 HTML 页面中提取一些内容及其对应的 Xpath

从由外部脚本生成的元素中删除 DOM 元素

选择在 iOS 应用上的外部浏览器中加载的内容

nodejs cheerio模块提取html页面内容

如何获取 Facebook 公共页面内容访问权限只是为了提取数据?

如何从网页中提取文本内容? [关闭]