使用 Xerces 将 DOM 序列化为 FileOutputStream
Posted
技术标签:
【中文标题】使用 Xerces 将 DOM 序列化为 FileOutputStream【英文标题】:Serialize DOM to FileOutputStream using Xerces 【发布时间】:2012-01-05 15:55:23 【问题描述】:我正在使用this 链接使用 DOM 生成 XML 文件。它说“Xerces 解析器与 JDK 1.5 发行版捆绑在一起。因此您无需单独下载解析器。”
但是,当我在 Eclipse Helios 中编写以下行时,即使我的系统中有 Java 1.6,它也会出现编译时错误。
import org.apache.xml.serialize.XMLSerializer;
为什么会这样?
【问题讨论】:
【参考方案1】:Xerces 确实与 JDK 捆绑在一起,但您应该将它与 javax.xml.parsers
下的 JAXP API 一起使用。检查下面程序的输出。
此外,要序列化 XML Document
,您应该使用 DOM 级别 3 加载和保存(存在于 JDK 中)或没有样式表的 XSLT 转换(身份转换)。其余的取决于特定的实现。 Xerces XMLSerializer 已弃用:
已弃用。此类在 Xerces 2.9.0 中已弃用。建议新应用程序使用 DOM Level 3 LSSerializer 或 JAXP 的 XML 转换 API (TrAX) 来序列化 XML。有关详细信息,请参阅 Xerces 文档。
这是一个使用 DOM 级别 3 的序列化示例:
import org.w3c.dom.*;
import org.w3c.dom.bootstrap.DOMImplementationRegistry;
import org.w3c.dom.ls.*;
public class DOMExample3
public static void main(String[] args) throws Exception
DOMImplementationRegistry registry = DOMImplementationRegistry.newInstance();
DOMImplementationLS impl = (DOMImplementationLS) registry.getDOMImplementation("XML 3.0 LS 3.0");
if (impl == null)
System.out.println("No DOMImplementation found !");
System.exit(0);
System.out.printf("DOMImplementationLS: %s\n", impl.getClass().getName());
LSParser parser = impl.createLSParser(
DOMImplementationLS.MODE_SYNCHRONOUS,
"http://www.w3.org/TR/REC-xml");
// http://www.w3.org/2001/XMLSchema
System.out.printf("LSParser: %s\n", parser.getClass().getName());
if (args.length == 0)
System.exit(0);
Document doc = parser.parseURI(args[0]);
LSSerializer serializer = impl.createLSSerializer();
LSOutput output = impl.createLSOutput();
output.setEncoding("UTF-8");
output.setByteStream(System.out);
serializer.write(doc, output);
System.out.println();
这是一个身份转换的例子:
import org.w3c.dom.Document;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.OutputKeys;
import javax.xml.transform.Result;
import javax.xml.transform.Source;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import javax.xml.transform.stream.StreamSource;
public class DOMExample2
public static void main(String[] args) throws Exception
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder parser = factory.newDocumentBuilder();
System.out.println("Parsing XML document...");
Document doc;
doc = parser.parse(args[0]);
// Xerces Java 2
/* Deprecated. This class was deprecated in Xerces 2.9.0.
* It is recommended that new applications use the DOM Level 3
* LSSerializer or JAXP's Transformation API for XML (TrAX)
* for serializing XML and html.
* See the Xerces documentation for more information.
*/
/*
System.out.println("XERCES: Displaying XML document...");
OutputFormat of = new OutputFormat(doc, "ISO-8859-1", true);
PrintWriter pw = new PrintWriter(System.out);
BaseMarkupSerializer bms = new XMLSerializer(pw, of);
bms.serialize(doc);
*/
// JAXP
System.out.println("JAXP: Displaying XML document...");
TransformerFactory transFactory = TransformerFactory.newInstance();
System.out.println(transFactory.getClass().getName());
//transFactory.setAttribute("indent-number", 2);
Transformer idTransform = transFactory.newTransformer();
idTransform.setOutputProperty(OutputKeys.METHOD, "xml");
idTransform.setOutputProperty(OutputKeys.INDENT,"yes");
// Apache default indentation is 0
idTransform.setOutputProperty("http://xml.apache.org/xsltindent-amount", "2");
Source input = new DOMSource(doc);
Result output = new StreamResult(System.out);
idTransform.transform(input, output);
【讨论】:
如果您认为它可能被视为答案,您可以标记它吗? 我通过点击“这个答案很有用”增加了计数:) 基于此制作了一些 Eclipse 详细格式化程序:gist.github.com/xkr47/9595446【参考方案2】:它将在 IIRC,com.sun.org.apache.xml.serialize.XMLSerializer
。但是,这些是私人课程,可能随时更改。我建议改用标准的公共 API(javax.*
和朋友)。 (使用不带任何 XSLT 的转换 API。)
【讨论】:
以上是关于使用 Xerces 将 DOM 序列化为 FileOutputStream的主要内容,如果未能解决你的问题,请参考以下文章
使用 Jackson XmlMapper 序列化为 XML DOM
使用 Apache ODF 工具包获取 java.lang.NoClassDefFoundError: org/apache/xerces/dom/ElementNSImpl
使用 Java 将补充 unicode 字符序列化为 XML 文档
java.lang.AbstractMethodError: org.apache.xerces.dom.ElementImpl.getTextContent()Ljava/lang/String
org.apache.xerces.dom.ElementNSImpl.setUserData(Ljava/lang/String;Ljava/lang