使用 PHP Simple HTML DOM Parser 查找和删除 html 标签

Posted

技术标签:

【中文标题】使用 PHP Simple HTML DOM Parser 查找和删除 html 标签【英文标题】:Finding and removing html tags with PHP Simple HTML DOM Parser 【发布时间】:2013-09-05 13:17:45 【问题描述】:

这是我正在使用的代码:

include 'simple_html_dom.php';
$html = file_get_html('index.html');
echo $html->find('tr', 15);

这将找到表格的第 15 行。我想要做的是完全删除该行。

我已经试过了

$html->find('tr', 15)=null; 

但这似乎不起作用。我尝试在SimpleHTMLDom documentation 上查找信息,但它没有包含太多信息。

【问题讨论】:

【参考方案1】:

simple_html_dom 似乎不允许删除。

试试这个:

$html = new DOMDocument();
$html->loadHTMLFile('index.html');
$element = $html->getElementsByTagName('tr')->item(15);
$element->parentNode->removeChild($element);

【讨论】:

脚本在我使用你的代码后停止响应。是否可以使用 phpquery 或任何其他库来这样做 抱歉,我已将$html = new DOMDocument; 更改为$html = new DOMDocument();,将load 更改为loadHTMLFile。这应该可行,我已经多次使用该方法。 你好朋友,这仍然没有删除任何东西,如果可能的话,你能告诉我工作的例子吗【参考方案2】:

这里有一个工作示例(在 Linux 中工作,但很容易适应)。

文件dom_test.php

#!/usr/bin/php
<?php
    $html = new DOMDocument();
    $html->loadHTMLFile('index.html');
    $element = $html->getElementsByTagName('tr')->item(1);
    $element->parentNode->removeChild($element);

    echo $html->saveHTML();
?>

index.html 包含的位置:

<html>
    <head></head>
    <body>
        <table>
            <tr><td> hi </td><td>there</td></tr>
            <tr>
                <td> HELLO </td>
                <td> there </td>
            </tr>
            <tr><td> hi </td><td>there</td></tr>
        </table>
    </body>
</html>

将两个文件放在同一个目录下,在控制台中执行:

php dom_test.php

输出将显示没有“HELLO there”行。

希望对你有帮助。

【讨论】:

【参考方案3】:

你可以用simple_html_dom做到这一点,只需将outertext设置为innertext的值

foreach($html->find('div') as $div) 
    $div->outertext = $div->innertext;

【讨论】:

以上是关于使用 PHP Simple HTML DOM Parser 查找和删除 html 标签的主要内容,如果未能解决你的问题,请参考以下文章

使用 PHP 和 Simple HTML DOM 解析 HTML 时遇到问题

使用php simple html dom parser解析html标签

php simple_html_dom.php 去掉html标签

php解析html类库simple_html_dom

使用 php simple html dom 抓取时需要帮助修复 html [重复]

使用 PHP Simple HTML DOM Parser 获取文本