XML文件解析-DOM4J方式和SAX方式

Posted 2020-10-06 JohnKing

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了XML文件解析-DOM4J方式和SAX方式相关的知识，希望对你有一定的参考价值。

最近遇到的工作内容都是和xml内容解析相关的.

1图片数据以base64编码的方式保存在xml的一个标签中,xml文件通过接口的方式发送给我,然后我去解析出图片数据,对图片进行进一步处理.

2.xml内容保存在blob字段中,然后jdbc读取blob字段获取xml内容进行解析.

解析的方法挺简单的,网上有很多种,主要有SAX,DOM4J等.

先来揭晓一下DOM4J是如何解析xml文件的,话不多少,直接上码.

    /**
     * 获取xml文件绝对路径
     */
    private String getFilePath() {
        String fileName = "test.xml";
        String filePath = System.getProperty("user.dir").replace("\\", "/")
        return filePath+"/"+fileName;
    }

    /**
     * 解析获取xml节点数据
     */
    private Map<String,String> parseXml(String filePath) {
        File xmlFile = new File(filepath);
        SAXReader reader = new SAXReader();
        Map<String,String> paramMap = new HashMap<String,String>();
        try {
            Document document = reader.read(xmlFile);
            Element rootElement = document.getRootElement();
            
            Element nameElement = rootElement.element("name");
            String name = nameElement.getText();
            paramMap.put("name",name);
            
            Element telElement = rootElement.element("tel");
            String tel = telElement.getText();
            paramMap.put("tel",tel);
            
            Element addressElement = rootElement.element("address");
            String address = addressElement.getText();
            paramMap.put("address",address);            
        } catch (Exception e) {
            logger.error("解析xml文件出错", e);
        }
        return paramMap;
    }

解析的xml文档如下

<?xml version="1.0" encoding="UTF-8"?>
<RootElement>
    <name>黑天鹅</name>
    <tel>12345678</tel>
    <address>反脆弱训练基地</address>
</RootElement>

然后我们揭晓一下SAX是如何进行xml解析的,直接上码.

    /**
     * xml文件内容解析
     * 
     * @param fileName
     * @return map
     * @throws Exception
     */
    public Map<String, String> parseXmlContent(byte[] fileContent) {
        Map<String, String> dataMap = new HashMap<String, String>();
        if (fileContent.length <= 0) {
            logger.error("获取文件流出错,文件流为空");
            return null;
        }
        try {
            ByteArrayInputStream input = new ByteArrayInputStream(fileContent);
            SAXParserFactory parsefactory = SAXParserFactory.newInstance();
            SAXParser parser = parsefactory.newSAXParser();
            SAXParseHandler parseHandler = new SAXParseHandler();
            parser.parse(input, new SAXParseHandler());
            dataMap = parseHandler.getXmlMap();
        } catch (Exception e) {
            System.out.println(e);
            logger.error("xml文件解析错误", e);
            return null;
        }
        return dataMap;
    }

SAX自定义一个解析类.

class SAXParseHandler extends DefaultHandler {

    private static Map<String, String> map;

    private String tagName;

    private StringBuilder sb;

    public void startDocument() throws SAXException {
        super.startDocument();
        map = new HashMap<String, String>();
    }

    public void endDocument() throws SAXException {
        super.endDocument();
    }

    /**
     * 获取文档属性,内容,执行多次
     */
    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
        super.startElement(uri, localName, qName, attributes);
        //在此可以获取标签属性内容
        this.tagName = qName;
        sb = new StringBuilder();

    }

    /**
     * 获取标签值,执行多次
     */
    public void endElement(String uri, String localName, String qName) throws SAXException {
        String data = sb.toString();
        if (StringUtils.isNotBlank(tagName)) {
            switch (tagName) {
            case "name":
                map.put("name", data);
                break;
            case "tel":
                map.put("tel", data);
                break;
            case "address":
                map.put("address", data);
                break;
            default:
                break;
            }
        }
    }

    public Map<String, String> getXmlMap() {
        return map;
    }

    /**
     * 获取整个文档数据
     */
    public void characters(char[] ch, int start, int length) throws SAXException {
        sb.append(new String(ch, start, length));
    }

测试主方法(开发时候用的,按需调试即可)

    public static void main(String[] args) throws IOException {
        File file = new File("F:\\test.xml");
        FileInputStream input = new FileInputStream(file);
        ByteArrayOutputStream output = new ByteArrayOutputStream();
        
        byte[] bt = new byte[1024];
        int n;
        while((n = input.read(bt)) != -1){
            output.write(bt, 0, n);
        }
        input.close();
        output.close();
        byte[] filebyte = output.toByteArray();
        XmlParser par = new XmlParser();
        Map<String, String> dataMap = par.parseXmlContent(filebyte);
        System.out.println(dataMap);        
    }

在解析xml的时候遇到了很多奇葩坑,用户标签不规范,发过来的数据没有标签的,还有发过来空文件的,真真够了.

尤其在解析blob字段中的xml内容数据时,也存在一些坑,到时候解决了在更新.

以上是关于XML文件解析-DOM4J方式和SAX方式的主要内容，如果未能解决你的问题，请参考以下文章

XML-入门级

对DOM，SAX，JDOM，DOM4J四种方法解析XML文件的分析

Java 解析XML的几种方式：DOMSAXJDOM和DOM4J。

Dom4j常用解析函数

XML解析方式与解析工具

javaweb学习总结十三(dom4j方式对XML文档进行解析)