使用Tidy重新格式化后,修复XML文件中的CDATA块

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用Tidy重新格式化后,修复XML文件中的CDATA块相关的知识,希望对你有一定的参考价值。

For some reason tidy inserts new lines before/after
  1. # command line/exec(),etc. or use the php functions to tidy up your document
  2. tidy -indent -utf8 -xml -wrap 1000 input.xml > output.xml
  3.  
  4. <?php
  5. /**
  6.   * Replaces invalid:
  7.   * <element>
  8.   * <![CDATA[whatever content]]>
  9.   * </element>
  10.   *
  11.   * With well-formed:
  12.   * <element><![CDATA[whatever content]]></element>
  13.   */
  14. $out = preg_replace('~>[s w ]+<![CDATA[~', '><![CDATA[', file_get_contents("output.xml"));
  15. $out = preg_replace('~]]>s+<~', ']]><', $out);
  16. file_put_contents("final.xml", $out);
  17. ?>

以上是关于使用Tidy重新格式化后,修复XML文件中的CDATA块的主要内容,如果未能解决你的问题,请参考以下文章

如何将 word 文件转换为 markdown 文件

JTidy解决中文乱码问题(亲测可用)

如何修复在python中选择文件后不断重新打开的文件对话框

硬盘变为raw是怎么回事?

xml文件无法打开,求解!

socket.io 1.2.1 如何在重新连接后修复双重事件