使用 PHP Simple HTML DOM Parser 查找和删除 html 标签
Posted
技术标签:
【中文标题】使用 PHP Simple HTML DOM Parser 查找和删除 html 标签【英文标题】:Finding and removing html tags with PHP Simple HTML DOM Parser 【发布时间】:2013-09-05 13:17:45 【问题描述】:这是我正在使用的代码:
include 'simple_html_dom.php';
$html = file_get_html('index.html');
echo $html->find('tr', 15);
这将找到表格的第 15 行。我想要做的是完全删除该行。
我已经试过了
$html->find('tr', 15)=null;
但这似乎不起作用。我尝试在SimpleHTMLDom documentation 上查找信息,但它没有包含太多信息。
【问题讨论】:
【参考方案1】:simple_html_dom 似乎不允许删除。
试试这个:
$html = new DOMDocument();
$html->loadHTMLFile('index.html');
$element = $html->getElementsByTagName('tr')->item(15);
$element->parentNode->removeChild($element);
【讨论】:
脚本在我使用你的代码后停止响应。是否可以使用 phpquery 或任何其他库来这样做 抱歉,我已将$html = new DOMDocument;
更改为$html = new DOMDocument();
,将load
更改为loadHTMLFile
。这应该可行,我已经多次使用该方法。
你好朋友,这仍然没有删除任何东西,如果可能的话,你能告诉我工作的例子吗【参考方案2】:
这里有一个工作示例(在 Linux 中工作,但很容易适应)。
文件dom_test.php
:
#!/usr/bin/php
<?php
$html = new DOMDocument();
$html->loadHTMLFile('index.html');
$element = $html->getElementsByTagName('tr')->item(1);
$element->parentNode->removeChild($element);
echo $html->saveHTML();
?>
index.html
包含的位置:
<html>
<head></head>
<body>
<table>
<tr><td> hi </td><td>there</td></tr>
<tr>
<td> HELLO </td>
<td> there </td>
</tr>
<tr><td> hi </td><td>there</td></tr>
</table>
</body>
</html>
将两个文件放在同一个目录下,在控制台中执行:
php dom_test.php
输出将显示没有“HELLO there”行。
希望对你有帮助。
【讨论】:
【参考方案3】:你可以用simple_html_dom做到这一点,只需将outertext设置为innertext的值
foreach($html->find('div') as $div)
$div->outertext = $div->innertext;
【讨论】:
以上是关于使用 PHP Simple HTML DOM Parser 查找和删除 html 标签的主要内容,如果未能解决你的问题,请参考以下文章
使用 PHP 和 Simple HTML DOM 解析 HTML 时遇到问题
使用php simple html dom parser解析html标签
php simple_html_dom.php 去掉html标签