将远程 HTML 中的图像 URL 解析为 JSON
Posted
技术标签:
【中文标题】将远程 HTML 中的图像 URL 解析为 JSON【英文标题】:Parsing image URLs in remote HTML as JSON 【发布时间】:2012-09-22 13:19:14 【问题描述】:我希望创建一个类似于 LinkedIn 和 Facebook 的 URL 共享器,您可以在其中粘贴 URL 并使用可用图像的滚动条拉取远程内容以使用?
基本上我的想法是我需要使用我的服务器端 XMLHTTP 脚本从远程 URL 中提取 html,然后我希望能够检查任何图像(超过一定的宽度/高度 - 例如没有加载跨像素。)
是否可以将所有远程 HTML 加载为可转义的 JSON,然后使用 Jquery 检查是否有合适的图像粘贴在滚动条中?
【问题讨论】:
您最好使用解析器搜索<img>
元素并获取它们的src
属性。
你建议我怎么做?干杯
我真的不知道问题的标签内。在 php 中,我会使用 DOMDocument
。
在php中,你可能想试试phpquery
【参考方案1】:
由于同源策略,您不能直接执行此操作,您将能够使用 iframe 获取网页,但无法读取其内容。您需要简单的服务器脚本作为代理。如果您使用 php 并且它允许将 url 作为文件打开,您将能够使用它:
<?php
if (isset($_GET['url']))
echo json_encode(get_file_contents($_GET['url']));
然后使用 ajax,您可以使用 url 获取页面,并且可以使用 jquery 作为解析器。
$.getJSON('fetch.php', url: "http://google.pl", function(html)
$(html).find('img');
);
【讨论】:
以上是关于将远程 HTML 中的图像 URL 解析为 JSON的主要内容,如果未能解决你的问题,请参考以下文章
为远程 html 页面从 Android 中的本地资产加载 jQuery
Rails:无法将图像解析为 URL:to_model 委托给附件,但附件为零 Rails 5.2