JavaSE XML解析技术的使用详解

Posted 学全栈的灌汤包

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了JavaSE XML解析技术的使用详解相关的知识,希望对你有一定的参考价值。

文章目录

XML解析技术

XML解析技术介绍

XML的数据作用是什么? 最终需要怎样处理?

作用: 存储数据、做配置信息、进行数据传输。

最终需要被程序进行读取,解析里面的信息。

XML解析就是使用程序读取XML中的数据:

有两种解析方式:

SAX解析

DOM解析(我们重点学习DOM解析)

DOM常见的解析工具:

名称说明
JAXPSUN公司提供的一套XML的解析的API
JDOMJDOM是一个开源项目,它基于树型结构,利用纯JAVA的技术对XML文档实现解析、生成、序列化以及多种操作。
dom4j是JDOM的升级品,用来读写XML文件的。具有性能优异、功能强大和极其易使用的特点,它的性能超过sun公司官方的dom 技术,同时它也是一个开放源代码的软件,Hibernate也用它来读写配置文件。
jsoup功能强大DOM方式的XML解析开发包,尤其对html解析更加方便

DOM解析, 解析文档对象模型如下:

其中:

  • Document对象: 代表整个xml文档对象
  • Element对象: 代表元素(标签), 例如上面student, name, age等等
  • Attribute对象: 代表属性, 例如上面的id
  • Text对象: 代表文本内容, 例如上面张三, 李四等等

Element、Attribute、Text对象都是一个Node节点, 实现了Node接口

Dom4j解析XML文件

Dom4j下载及导入:

下载Dom4j框架,官网下载。

在项目中创建一个文件夹:lib

将dom4j-2.1.1.jar文件复制到 lib 文件夹

在jar文件上点右键,选择 Add as Library -> 点击OK

在类中导包使用

案例:

使用Dom4J把一个XML文件的数据进行解析

Dom4j解析XML-得到Document对象:

SAXReader类

构造器/方法说明
SAXReader()创建Dom4J的解析器对象
read(String url)加载XML文件成为Document对象

Document类

方法名说明
getRootElement()获得根元素对象

实现步骤:

步骤一: 准备一个XML文件

<?xml version="1.0" encoding="UTF-8"?>
<books>
    <book id="0001" desc="我是第一本书">
        <name>     JavaWeb开发教程</name>
        <author> 张孝祥    </author>
        <sale>100.00元</sale>
    </book>
    <book id="0002">
        <name>三国演义</name>
        <author>罗贯中</author>
        <sale>100.00元</sale>
    </book>
    <sql>
        select * from user where age >= 18
    </sql>
</books>

步骤二: 创建一个Domj解析器对象, 加载XML文件称为Document对象

步骤三: 获取根元素对象

public static void main(String[] args) throws Exception 
    // 1. 创建一个Dom4j解析对象
    SAXReader saxReader = new SAXReader();
    // 把XML文件加载到内存中成为一个Document对象
    // Document document = saxReader.read(new File("/Users/chenyq/Documents/learn_Java/code/JavaSE/xml-app/src/books.xml"));
    InputStream is = Dom4jDemo.class.getResourceAsStream("/books.xml");
    Document document = saxReader.read(is);

    // 2. 获取根元素对象
    Element root = document.getRootElement();

Dom4j解析各个节点

Dom4j解析XML的元素、属性、文本的方法如下:

方法名说明
List<Element> elements()得到当前元素下所有子元素
List<Element> elements(String name)得到当前元素下指定名字的子元素返回集合
Element element(String name)得到当前元素下指定名字的子元素,如果有很多名字相同的返回第一个
String getName()得到元素名字
String attributeValue(String name)通过属性名直接得到属性值
String elementText(子元素名)得到指定名称的子元素的文本
String getText()得到文本

演示代码:

public static void main(String[] args) throws Exception 
    SAXReader saxReader = new SAXReader();
    InputStream is = Dom4jDemo.class.getResourceAsStream("/books.xml");
    Document document = saxReader.read(is);

    Element root = document.getRootElement();

    // 获取根元素下的所有子元素
    List<Element> allsonEls = root.elements();
    // 打印子元素的名称
    for (Element allsonEl : allsonEls) 
        System.out.println(allsonEl.getName()); // book book sql
    

    // 获取当前元素下指定名字的子元素返回的集合
    List<Element> bookEls = root.elements("book");
    for (Element bookEl : bookEls) 
        System.out.println(bookEl.getName()); // book book
    

    // 得到当前元素下指定名字的子元素,如果有很多名字相同的返回第一个
    Element bookEL = root.element("book");
    System.out.println(bookEL.getName()); // book

    // 通过属性名获取属性值
    System.out.println(bookEL.attributeValue("id")); // 0001

    // 得到指定名称的子元素的文本
    System.out.println(bookEL.elementText("name")); //      JavaWeb开发教程

    // 得到文本
    System.out.println(bookEL.element("sale").getText()); // 100.00元

Dom4j解析案例实战

需求:

利用Dom4J的知识,将Contact.xml文件中的联系人数据封装成List集合,其中每个元素是实体类Contact。打印输出 List 中的每个元素。

Contact.xml文件内容如下:

<?xml version="1.0" encoding="UTF-8"?>
<contactList>
    <contact id="1">
        <name>潘金莲</name>
        <gender></gender>
        <email>panpan@itcast.cn</email>
    </contact>
    <contact id="2">
        <name>武松</name>
        <gender></gender>
        <email>wusong@itcast.cn</email>
    </contact>
    <contact id="3">
        <name>武大狼</name>
        <gender></gender>
        <email>wuda@itcast.cn</email>
    </contact>
    <user>
    </user>
</contactList>

要求打印结果如下图所示:

实现步骤如下:

步骤一: 创建一个Contact类

public class Contact 
    private int id;
    private String name;
    private char gender;
    private String email;

    public Contact() 

    public Contact(int id, String name, char gender, String email) 
        this.id = id;
        this.name = name;
        this.gender = gender;
        this.email = email;
    

    public int getId() 
        return id;
    

    public void setId(int id) 
        this.id = id;
    

    public String getName() 
        return name;
    

    public void setName(String name) 
        this.name = name;
    

    public char getGender() 
        return gender;
    

    public void setGender(char gender) 
        this.gender = gender;
    

    public String getEmail() 
        return email;
    

    public void setEmail(String email) 
        this.email = email;
    

    @Override
    public String toString() 
        return "Contact" +
                "id=" + id +
                ", name='" + name + '\\'' +
                ", gender=" + gender +
                ", email='" + email + '\\'' +
                '';
    

步骤二: 在主类中进行下面操作

  • 创建Dom4j解析器, 加载XML文件为Document对象
  • 获取根元素对象
  • 获取所有的contact元素
  • 准备一个集合装contact对象, 遍历所有的contact元素, 获取类的成员变量的值添加到List集合中
public static void main(String[] args) throws Exception 
    // 创建Dom4j解析器, 加载XML文件为Document对象
    SAXReader saxReader = new SAXReader();
    InputStream is = Dom4jDemo.class.getResourceAsStream("/Contacts.xml");
    Document document = saxReader.read(is);
    // 获取根元素对象
    Element root = document.getRootElement();

    // 获取所有的contact元素
    List<Element> contactELs = root.elements("contact");
    // 准备一个集合装contact对象
    List<Contact> contacts = new ArrayList<>();
    // 遍历contactELs
    int id = 0;
    for (Element contactEL : contactELs) 
        Contact contact = new Contact();
        contact.setId(Integer.valueOf(contactEL.attributeValue("id")));
        contact.setName(contactEL.elementText("name"));
        contact.setGender(contactEL.elementText("gender").charAt(0));
        contact.setEmail(contactEL.elementText("email"));

        // 加入到List集合
        contacts.add(contact);
    
    // 遍历集合
    for (Contact contact : contacts) 
        System.out.println(contact);
    

打印结果

Contactid=1, name='潘金莲', gender=女, email='panpan@itcast.cn'
Contactid=2, name='武松', gender=男, email='wusong@itcast.cn'
Contactid=3, name='武大狼', gender=男, email='wuda@itcast.cn'

以上是关于JavaSE XML解析技术的使用详解的主要内容,如果未能解决你的问题,请参考以下文章

JavaEE实战——XML文档DOMSAXSTAX解析方式详解

JAVASE02-Unit012: Unit07: XML语法 XML解析

PMS解析AndroidManifest.xml详解

Android--使用XMLPull解析xml

XML注入详解 xxe注入攻击

详解Java解析XML的四种方法