基于DOM的XML文件解析类
Posted FunTester
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于DOM的XML文件解析类相关的知识,希望对你有一定的参考价值。
最近公司做服务配置检查,特别是zookeeper
配置里面关于数据库、redis、域名的配置。刚好还没弄过XML
解析,所以顺手封装了一个工具类。
XML
文件解析分四类方式:「DOM解析」;「SAX解析」;「JDOM解析」;「DOM4J解析」。其中前两种属于基础方法,是官方提供的平台无关的解析方式;后两种属于扩展方法,它们是在基础的方法上扩展出来的,只适用于java平台。
权衡之后我先选择了「DOM解析」,因为文件不大(1万行),只是一次性的脚本,不存在性能方面的考虑。
xml
文件内容(已删节);
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<root path="/xdfapp">
<zknode name="DCSS" value="38d9ab9f3e7b424324cea3e42fb1237f9e73bdb">
<zknode name="v1.0$">
<zknode name="unchange">
<zknode name="datadb.database"
value="Export from zookeeper configuration group: [/xdfapp/DCSS] - [v1.0] - [unchange]."/>
<zknode name="redis.host"/>
<zknode name="db.host.w"/>
<zknode name="datadb.password" value="127.0.0.1"/>
<zknode name="datadb.host.r"/>
<zknode name="db.host.r"/>
<zknode name="datadb.host.w"/>
</zknode>
</zknode>
</zknode>
</root>
下面分享Demo:
package com.fun.ztest.groovy
import com.fun.base.bean.AbstractBean
import com.fun.base.exception.FailException
import com.fun.frame.SourceCode
import org.slf4j.Logger
import org.slf4j.LoggerFactory
import org.w3c.dom.Document
import org.w3c.dom.NamedNodeMap
import org.w3c.dom.Node
import org.w3c.dom.NodeList
import org.xml.sax.SAXException
import javax.xml.parsers.DocumentBuilder
import javax.xml.parsers.DocumentBuilderFactory
import javax.xml.parsers.ParserConfigurationException
class XMLUtil extends SourceCode {
private static Logger logger = LoggerFactory.getLogger(XMLUtil.class)
public static void main(String[] args) {
def xml = parseXml("/Users/fv/Downloads/dev.xml", "root")
output(xml)
}
public static List<NodeInfo> parseXml(String path, String root) {
NodeList nodes = parseRoot(path, root)
return range(nodes.getLength()).mapToObj {x -> parseNode(nodes.item(x))}.collect() as List
}
public static NodeList parseRoot(String path, String root) {
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance()
try {
DocumentBuilder db = dbf.newDocumentBuilder()
Document document = db.parse(new File(path))
NodeList bookList = document.getElementsByTagName(root)
return bookList
} catch (ParserConfigurationException e) {
logger.error("解析配置错误!", e)
} catch (IOException e) {
logger.error("IO错误!", e)
} catch (SAXException e) {
logger.error("SAX错误!", e)
}
FailException.fail("解析文件:${path}中${root}节点出错!")
}
public static NodeInfo parseNode(Node node) {
if (node.getNodeType() != node.ELEMENT_NODE) return null
NodeInfo nodeInfo = new NodeInfo()
NamedNodeMap attrs = node.getAttributes()
List<Attr> nodeAttr = new ArrayList<>()
range(attrs.getLength()).each {
Node attr = attrs.item(it)
String nodeName = attr.getNodeName()
String nodeValue = attr.getNodeValue()
Attr e = new Attr(nodeName, nodeValue)
nodeAttr.add(e)
}
nodeInfo.arrts = nodeAttr
short nodeType = node.getNodeType()
if (nodeType != Node.ELEMENT_NODE) return nodeInfo
NodeList childNodes = node.getChildNodes()
List<NodeInfo> children = new ArrayList<>()
childNodes.getLength()
range(childNodes.getLength()).each {children.add(parseNode(childNodes.item(it)))}
nodeInfo.children = children.findAll {it != null}
return nodeInfo
}
static class NodeInfo extends AbstractBean {
private static final long serialVersionUID = 568896512159847L
List<Attr> arrts
List<NodeInfo> children
}
static class Attr extends AbstractBean {
private static final long serialVersionUID = -35484487563215649L
String name
String value
public Attr(String name, String value) {
this.name = name
this.value = value
}
}
}
控制台输出:
内容较多,分成了头尾两张。
FunTester热文精选
以上是关于基于DOM的XML文件解析类的主要内容,如果未能解决你的问题,请参考以下文章