java基础71 XML解析相关知识点（网页知识）

Posted 2021-01-01 DSHORE

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了java基础71 XML解析相关知识点（网页知识）相关的知识，希望对你有一定的参考价值。

本文知识点（目录）：本文下面的“实例及附录”全是DOM解析的相关内容

    1、xml解析的含义
    2、XML的解析方式
    3、xml的解析工具
    4、XML的解析原理
    5、实例
    6、附录1（获取xml中的所有节点、根标签、根标签下的子标签、子标签中的文本内容）
    7、附录2（获取xml中的所有节点、根标签、根标签下的子标签、子标签中的文本内容）
    8、附录3（把xml文档中的信息封装到对象中）

1、xml解析的含义

xml文件除了给开发者看，更多情况下是使用程序读取xml文件中的内容

2、XML的解析方式

DOM解析
SAX解析

3、xml的解析工具

3.1、DOM解析工具

    1.JAXP(oracle-Sun公司官方)
    2.JDOM工具(非官方)
    3.Dom4j工具(非官方的)。三大框架(默认读取xml的工具就是DOM4j)

3.2、SAX解析工具

1.Sax解析工具(oracle-Sun公司官方)

4、XML的解析原理

4.1、DOM解析的原理

xml解析器一次性把整个xml文档加载进内存，然后在内存中构建一个Document的对象树，通过document对象，得到树上的节点对象，通过节点对象访问(操作)到xml文档的内容.

缺点：内存消耗大
优点：文档增删改查比较容易

4.2、SAX解析的原理

从上往下读，读一行处理一行。 DOM与SAX解析的区别 SAX解析原理

优点：内存消耗小，适合读
缺点：不适合增删改

5、实例

例1：

 1 package com.bw.test;
 2 
 3 import org.dom4j.Document;
 4 import org.dom4j.DocumentException;
 5 import org.dom4j.io.SAXReader;
 6 
 7 public class Demo1 {
 8     /*
 9      * 第一个Dom4j读取xml文档的例子
10      * 
11      * */
12     public static void main(String[] args) {
13         try {
14             //1.创建一个xml解析器对象
15             SAXReader reader = new SAXReader();
16             //2.读取xml文档,返回Document对象
17             Document doc= reader.read("./src/contact.xml");
18             System.out.println(doc);
19         } catch (DocumentException e) {
20             // TODO Auto-generated catch block
21             e.printStackTrace();
22         }
23     }
24 }

contact.xml文件

 1 <?xml version="1.0" encoding="utf-8"?>
 2 <contactList>
 3     <contact id="001" sex="男">
 4         <name>张三</name>
 5         <age>18</age>
 6         <phone>15779593710</phone>
 7         <email>872855221@qq.com</email>
 8         <qq>872855221</qq>
 9         <abc>
10             <a><b></b></a>
11         </abc>
12     </contact>
13     <contact id="038">
14         <name>李四</name>
15         <age>20</age>
16         <phone>1314580</phone>
17         <email>12580@qq.com</email>
18         <qq>832144529</qq>
19     </contact>
20 </contactList>

例2：

 1 package com.shore.test;
 2 
 3 import java.io.File;
 4 import java.util.Iterator;
 5 import java.util.List;
 6 
 7 import org.dom4j.Document;
 8 import org.dom4j.DocumentException;
 9 import org.dom4j.Element;
10 import org.dom4j.Node;
11 import org.dom4j.io.SAXReader;
12 import org.junit.Test;
13 
14 /**
15  * @author DSHORE / 2018-8-29
16  *
17  */
18 public class Demo1 {
19     @Test
20     public void test1() throws DocumentException{
21         //1.读取xml文档,返回一个document对象
22         SAXReader reader=new SAXReader();
23         Document doc=reader.read(new File("./src/contact.xml"));
24         //nodeIterator:得到当前节点下的所有子节点对象(不包含孙以及孙以下的节点)
25         Iterator<Node> it=doc.nodeIterator();
26         while(it.hasNext()){//判断是否有下一位元素
27             Node node=it.next();
28             System.out.println(node.getName());
29             //继续获取下面的子节点
30             //只有标签有子节点
31             //判断当前节点是否为标签节点
32             if(node instanceof Element){
33                 Element elem=(Element)node;
34                 Iterator<Node> it2=elem.nodeIterator();
35                 while(it2.hasNext()){
36                     Node n2=it2.next();
37                     System.out.println(n2.getName());
38                 }    
39             }        
40         }
41     }
42 }

实例结果图

附录1

  1 package com.shore.test;
  2 
  3 import java.io.File;
  4 import java.util.Iterator;
  5 import java.util.List;
  6 
  7 import org.dom4j.Attribute;
  8 import org.dom4j.Document;
  9 import org.dom4j.DocumentException;
 10 import org.dom4j.Element;
 11 import org.dom4j.Node;
 12 import org.dom4j.io.SAXReader;
 13 import org.junit.Test;
 14 
 15 /**
 16  * @author DSHORE / 2018-8-29
 17  *
 18  */
 19 /*
 20  * 第二个dom4j读取的xml文件内容
 21  * 节点
 22  * 标签
 23  * 属性
 24  * 文本
 25  * */
 26 public class Demo1 {
 27     @Test
 28     public void test1() throws DocumentException{
 29         //1.读取xml文档,返回一个document对象
 30         SAXReader reader=new SAXReader();
 31         Document doc=reader.read(new File("./src/contact.xml"));
 32         //nodeIterator:得到当前节点下的所有子节点对象(不包含孙以及孙以下的节点)
 33         Iterator<Node> it=doc.nodeIterator();
 34         while(it.hasNext()){//判断是否有下一位元素
 35             Node node=it.next();
 36             System.out.println(node.getName());
 37             //继续获取下面的子节点
 38             //只有标签有子节点
 39             //判断当前节点是否为标签节点
 40             if(node instanceof Element){
 41                 Element elem=(Element)node;
 42                 Iterator<Node> it2=elem.nodeIterator();
 43                 while(it2.hasNext()){
 44                     Node n2=it2.next();
 45                     System.out.println(n2.getName());
 46                 }    
 47             }        
 48         }
 49     }
 50     /*
 51      * 遍历xml文件的所有节点
 52      * */
 53     @Test
 54     public void test2() throws DocumentException{
 55         //1.读取xml文档获取Document对象
 56         SAXReader reader=new SAXReader();
 57         Document doc=reader.read(new File("./src/contact.xml"));
 58         //得到跟标签
 59         Element rootEls=doc.getRootElement();
 60         getChildNodes(rootEls);
 61     }
 62     /*
 63      * 获取传入标签下的所有子标签
 64      * */
 65     private void getChildNodes(Element rootEls) {
 66         if(rootEls instanceof Element){
 67             System.out.println(rootEls.getName());
 68         }
 69         //得到子节点
 70         Iterator<Node> it=rootEls.nodeIterator();
 71         while(it.hasNext()){
 72             Node node=it.next();
 73             //判断是否是标签节点
 74             if(node instanceof Element){
 75                 Element el=(Element)node;
 76                 //递归
 77                 getChildNodes(el);
 78             }
 79         }
 80     }
 81     /*
 82      * 获取标签
 83      * */
 84     @Test
 85     public void test3() throws DocumentException{
 86         //1.读取xml文档,返回Document对象
 87         SAXReader reader=new SAXReader();
 88         Document doc=reader.read(new File("./src/contact.xml"));
 89         //得到跟标签
 90         Element elt=doc.getRootElement();
 91         //得到标签名称
 92         String name=elt.getName();
 93         System.out.println(name);//返回值：contactList
 94         
 95         //方法1：得到当前标签下指定的名称的第一个子标签
 96         Element contactElem=elt.element("contact");
 97         String name1=contactElem.getName();
 98         System.out.println(name1);//返回值：contact
 99         
100         //方法2：得到当前根标签下的所有下一级子标签
101         List<Element> list=elt.elements();
102         //遍历list
103         //1).传统的for循环   2).增强for循环  3).迭代器
104         for(int i=0;i<list.size();i++){
105             Element e=list.get(i);
106             System.out.println(e.getName());//返回值：contact   注意：这里的返回值是有两个contact，因为contact.xml文件中有两个根标签的下一级标签contact(两个contact是同一级)
107         }
108         for (Element e : list) {//增强for循环
109             System.out.println(e.getName());//返回值：contact   同上
110         }
111         Iterator<Element> it=list.iterator();
112         while(it.hasNext()){//迭代器
113             Element e=it.next();
114             System.out.println(e.getName());//返回值：contact   同上
115         }
116         
117         //方法3：获取更深层次标签(方法只能一层层地获取)
118         Element element=doc.getRootElement().element("contact").element("name");
119         System.out.println(element.getName());//返回值：name
120     }
121     /*
122      * 获取属性值
123      * */
124     @Test
125     public void test4() throws DocumentException{
126         //1.读取xml文档,返回一个Document对象
127         SAXReader reader=new SAXReader();
128         Document doc=reader.read(new File("./src/contact.xml"));
129         //获取属性(先获取标签对象,然后在获取属性)
130         //获得标签对象
131         Element contactElt=doc.getRootElement().element("contact");
132         //获取属性，得到指定名称属性值
133         String idValue=contactElt.attributeValue("id");
134         System.out.println(idValue);//返回值：001
135         //得到指定属性名称的属性对象
136         Attribute idAttr=contactElt.attribute("id");
137         //getName()属性名   getValue属性值
138         System.out.println(idAttr.getName()+"/"+idAttr.getValue());//返回值：id/001
139     }
140 }

结果图

注：test3()的结果，看代码中的注释

附录2

 1 package com.shore.test;
 2 
 3 import java.io.File;
 4 import java.util.Iterator;
 5 import java.util.List;
 6 
 7 import org.dom4j.Attribute;
 8 import org.dom4j.Document;
 9 import org.dom4j.DocumentException;
10 import org.dom4j.Element;
11 import org.dom4j.io.SAXReader;
12 import org.junit.Test;
13 /**
14  * @author DSHORE / 2018-8-29
15  *
16  */
17 
18 public class Demo2 {
19     /*
20      * 获取属性
21      * */
22     @Test
23     public void test() throws DocumentException{
24         //1.解析xml文档,返回一个document对象
25         Document doc=new SAXReader().read(new File("./src/contact.xml"));
26         //获取属性:(先获取属性所在标签对象,然后才能获取属性值)
27         //2.得到标签
28         Element elt=doc.getRootElement().element("contact");
29         //3.得到属性
30         //得到指定名称的属性值
31         String idValue=elt.attributeValue("id");
32         System.out.println(idValue);//返回值：001
33         //得到指定名称的属性对象
34         Attribute aib=elt.attribute("id");
35         //getName() 属性名称       getValue()属性值
36         System.out.println("属性名称："+aib.getName()+"/"+"属性值："+aib.getValue());//返回值：属性名称：id/属性值：001
37 
38         //方式1：得到所有属性对象,返回一个list()
39         List<Attribute> list=elt.attributes();
40         for (Attribute attr: list) {
41             System.out.println(attr.getName());//返回值：id/001   sex/男
42         }
43         
44         //方式2：得到所有属性对象,返回一个迭代器
45         Iterator<Attribute> attr2=elt.attributeIterator();
46         while(attr2.hasNext()){
47             Attribute a=attr2.next();
48             System.out.println(a.getName()+"/"+a.getValue());//返回值：id/001   sex/男
49         }
50     }
51     /*
52      * 获取文本内容
53      * */
54     @Test
55     public void test2() throws DocumentException{
56         //1.解析xml文档,返回一个document对象
57         Document doc=new SAXReader().read(new File("./src/contact.xml"));
58         /*
59          * 注意:空格和换行也是xml的内容
60          * */
61         String content=doc.getRootElement().getText();
62         //获取文本内容(先获取标签,在获取标签上的内容)
63         Element elt=doc.getRootElement().element("contact").element("name");
64         //方式1：得到文本内容
65         String test=elt.getText();
66         System.out.println(test);//返回值：张三
67         
68         //方式2：得到指定标签的文本内容
69         String test2=doc.getRootElement().element("contact").elementText("phone");
70         System.out.println(test2);    //返回值：15779593710
71     }
72 }

附录3

contact.xml文件

 1 <?xml version="1.0" encoding="utf-8"?>
 2 <contactList>
 3     <contact id="001" sex="男">
 4         <name>张三</name>
 5         <age>18</age>
 6         <phone>15779593710</phone>
 7         <email>872855221@qq.com</email>
 8         <qq>872855221</qq>
 9         <abc>
10             <a>  </a>
11         </abc>
12     </contact>
13     <contact id="038">
14         <name>李四</name>
15         <age>20</age>
16         <phone>1314580</phone>
17         <email>12580@qq.com</email>
18         <qq>832144529</qq>
19     </contact>
20 </contactList>

Contact实体(模型)

 1 package com.shore.test;
 2 
 3 /**
 4  * @author DSHORE / 2018-8-29
 5  *
 6  */
 7 public class Contact {
 8     private String id;
 9     private String name;
10     private String age;
11     private String phone;
12     private String email;
13     private String qq;
14     
15     public 以上是关于java基础71  XML解析相关知识点（网页知识）的主要内容，如果未能解决你的问题，请参考以下文章