使用简单的 html dom 获取 url-data 属性

Posted

技术标签:

【中文标题】使用简单的 html dom 获取 url-data 属性【英文标题】:Fetch url-data attribute using simple html dom 【发布时间】:2015-08-27 03:55:48 【问题描述】:

我关心的是使用 php html dom 库从 div 中提取链接。

代码示例:

include("simple_html_dom.php");
$html='
<div id="base" url-data="http://www.domaine.com/page?user=username"></div>
<div id="base" url-data="http://www.domaine.info/page?user=username"></div>
<div id="base" url-data="http://www.domaine.org/page?user=username"></div>
<div id="base" url-data="http://www.domaine.net/page?user=username"></div>
<div id="base" url-data="http://www.domaine.biz/page?user=username"></div>
<div id="base" url-data="http://www.domaine.fr/page?user=username"></div>
';

我需要从 div 中获取所有域名,然后使用简单的 html dom 解析器示例将它们存储在 php 数组中:

domaine.com,domaine.info,domaine.org,domaine.net,domaine.biz,domaine.fr

谢谢。

【问题讨论】:

到目前为止你尝试过什么?你有什么问题?我会帮忙,但我不会为你写代码…… 这就是你想要的? @Anas El Fakir 是的,谢谢。 【参考方案1】:
include("simple_html_dom.php");
$html='
<div id="base" url-data="http://www.domaine.com/page?user=username"></div>
<div id="base" url-data="http://www.domaine.info/page?user=username"></div>
<div id="base" url-data="http://www.domaine.org/page?user=username"></div>
<div id="base" url-data="http://www.domaine.net/page?user=username"></div>
<div id="base" url-data="http://www.domaine.biz/page?user=username"></div>
<div id="base" url-data="http://www.domaine.fr/page?user=username"></div>
';
$str_html=str_get_html($html);
// $file_html=file_get_html($html); // use file_get_html if you parse an url.
$div=$str_html->find("div#base");
$count=count($div)-1;
for($a=0;$a<=$count;$a++)
    $url=$str_html->find("div#base",$a)->getAttribute('url-data');
    $parse = parse_url($url);
    $domain = $parse['host'];
    $array[]=$domain;

print_r($array);

【讨论】:

发现是慢功能。我觉得更好$divs = $str_html-&gt;find("div#base"); foreach($divs as $div)....

以上是关于使用简单的 html dom 获取 url-data 属性的主要内容,如果未能解决你的问题,请参考以下文章

获取注释块之间的 html 简单的 HTML DOM

如何使用 PHP 简单的 html dom 获取特定的表格单元格值

DOM简单学习事件简单学习

输入字段中的简单 HTML DOM 解析器

HTML DOM 属性

JS获取HTML DOM元素的8种方法