将远程 HTML 中的图像 URL 解析为 JSON

Posted

技术标签:

【中文标题】将远程 HTML 中的图像 URL 解析为 JSON【英文标题】:Parsing image URLs in remote HTML as JSON 【发布时间】:2012-09-22 13:19:14 【问题描述】:

我希望创建一个类似于 LinkedIn 和 Facebook 的 URL 共享器,您可以在其中粘贴 URL 并使用可用图像的滚动条拉取远程内容以使用?

基本上我的想法是我需要使用我的服务器端 XMLHTTP 脚本从远程 URL 中提取 html,然后我希望能够检查任何图像(超过一定的宽度/高度 - 例如没有加载跨像素。)

是否可以将所有远程 HTML 加载为可转义的 JSON,然后使用 Jquery 检查是否有合适的图像粘贴在滚动条中?

【问题讨论】:

您最好使用解析器搜索<img> 元素并获取它们的src 属性。 你建议我怎么做?干杯 我真的不知道问题的标签内。在 php 中,我会使用 DOMDocument 在php中,你可能想试试phpquery 【参考方案1】:

由于同源策略,您不能直接执行此操作,您将能够使用 iframe 获取网页,但无法读取其内容。您需要简单的服务器脚本作为代理。如果您使用 php 并且它允许将 url 作为文件打开,您将能够使用它:

<?php 

if (isset($_GET['url'])) 
   echo json_encode(get_file_contents($_GET['url']));

然后使用 ajax,您可以使用 url 获取页面,并且可以使用 jquery 作为解析器。

$.getJSON('fetch.php', url: "http://google.pl", function(html) 
   $(html).find('img');
);

【讨论】:

以上是关于将远程 HTML 中的图像 URL 解析为 JSON的主要内容,如果未能解决你的问题,请参考以下文章

将 URL 数组转换为 xcode 中的图像 url 数组

为远程 html 页面从 Android 中的本地资产加载 jQuery

从 C# 中的属性获取图像 URL

Rails:无法将图像解析为 URL:to_model 委托给附件,但附件为零 Rails 5.2

解析 HTML 源代码以获取没有错误的图像的 url。 (首选 Python)[关闭]

使用 Webpack 解析 css 背景图像 url