4-8《XML与JSON》——XML解析XMLSAXDOM4JXStreamJSONGsonFastjson

Posted 美少女降临人世间

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了4-8《XML与JSON》——XML解析XMLSAXDOM4JXStreamJSONGsonFastjson相关的知识,希望对你有一定的参考价值。

文章目录

XML与JSON

一、XML

1、XML概述

XML是可扩展标记语言(eXtensible Markup Language)。

  • 特性:
  1. xml具有平台无关性, 是一门独立的标记语言
  2. xml具有自我描述性
  • 使用XML进行:
  1. 网络数据传输
  2. 数据存储
  3. 配置文件
  • .XML文件是保存XML数据的一种方式

    XML数据也可以以其他的方式存在(如在内存中构建XML数据)

    不要将XML语言狭隘的理解成XML文件。

1.XML语法格式

  1. XML文档声明

    <?xml version="1.0" encoding="UTF-8"?>

  2. 标记 ( 元素 / 标签 / 节点)

    XML文档,由一个个的标记组成

    • 语法:

    ​ 开始标记(开放标记):<标记名称>

    ​ 结束标记(闭合标记):</标记名称>

    • 标记名称:自定义名称

    必须遵循以下命名规则

    1. 名称可以含字母、数字以及其他的字符

    2. 名称不能以数字或者标点符号开始

    3. 名称不能以字符 “xml”(或者 XML、Xml)开始

    4. 名称不能包含空格,不能包含冒号(:)

    5. 名称区分大小写

    • 标记内容: 开始标记与结束标记之间 ,是标记的内容.

      例如 ,我们通过标记, 描述一个人名:

      <name>人名</name>

  3. 一个XML文档中, 必须有且且仅允许有一个根标记

    <names>
    	<name>张三</name>
    	<name>李四</name>
    </names>
    
  4. 标记可以嵌套,但是不允许交叉

    <person>
    	<name>李四</name>
    	<age>18</age>
    </person>
    
  5. 标记的层级称呼

    (子标记、父标记 、兄弟标记、后代标记、祖先标记)

    <persons>
    	<person>
    		<name>李四</name>
    		<length>180cm</length>
    	</person>
    	<person>
    		<name>李四</name>
    		<length>200cm</length>
    	</person>
    </persons>
    

    name是person的子标记,也是person的后代标记

    name是persons的后代标记

    name是length的兄弟标记

    person是name的父标记

    persons是name的祖先标记

  6. 标记名称 允许重复

  7. 标记除了开始和结束,还有属性

    标记中的属性,在标记开始时描述,由属性名和属性值组成

    • 格式:

      ​ 在开始标记中描述属性

      ​ 可以包含0-n个属性,每一个属性是一个键值对

      属性名不允许重复,键与值之间使用等号连接,多个属性之间使用空格分割

      属性值必须被引号引住

    <persons>
    	<person id="10001" groupid="1">
    		<name>李四</name>
    		<age>18</age>
    	</person>
    	<person id="10002" groupid="1">
    		<name>李四</name>
    		<age>20</age>
    	</person>
    </persons>
    
  8. 注释

    注释不能写在文档文档声明前

    注释不能嵌套注释

    • 格式:

      ​ 注释开始:<!--

      ​ 注释结束:-->

    例:

    描述一组图书books,至少包含3本书
    图书book包含:图书名称name、图书简介info,以及属性id

    <?xml version="1.0" encoding="UTF-8" ?>
    <books>
        <book id="1">
            <name>小王子</name>
            <info>小王子遨游太空的梦幻故事。</info>
        </book>
        <book id="2">
            <name>阿凡提</name>
            <info>阿凡提智斗吝啬的地主。</info>
        </book>
        <book id="3">
            <name>小狐狸</name>
            <info>狐狸妹妹今天又变漂亮了。</info>
        </book>
    </books>
    

2.语法进阶CDATA(了解)

CDATA 是不应该由 XML 解析器解析的文本数据。

像 “<” 和 “&” 字符在 XML 元素中都是非法的。

“<” 会产生错误,因为解析器会把该字符解释为新元素的开始。

“&” 会产生错误,因为解析器会把该字符解释为字符实体的开始。

某些文本,比如 JavaScript 代码,包含大量 “<” 或 “&” 字符。为了避免错误,可以将脚本代码定义为 CDATA。

CDATA 部分中的所有内容都会被解析器忽略。

CDATA 部分由<![CDATA[开始,由]]>结束。

2、解析XML

Java中有4种XML解析方式:SAX、DOM、JDOM、DOM4J;也可以理解为SAX和DOM解析两种。

SAX和DOM的区别是什么?

生活之中阅读文章的方式:逐行阅读、略读整篇。

SAX:逐行阅读,看完一行在看下一行,对阅读容量要求不高,一行即可。

DOM:生背一篇文章,背完之后再进行解析

1.SAX解析

事件驱动机制,关键节点处发生事件。

优点:

​ 分析能够立即开始,而不是等待所有的数据被处理

​ 逐行加载,节省内存.有助于解析大于系统内存的文档

​ 有时不必解析整个文档,它可以在某个条件得到满足时停止解析

缺点:

​ 单向解析,无法定位文档层次,无法同时访问同一文档的不同部分数据(因为逐 行解析, 当解析第n行是, 第n-1行已经被释放了, 无法在进行操作了)

​ 无法得知事件发生时元素的层次, 只能自己维护节点的父/子关系

​ 只读解析方式, 无法修改XML文档的内容

2.DOM解析

是用与平台和语言无关的方式表示XML文档的官方W3C标准,分析该结构通常需要加载整个文档和内存中建立文档树模型程序员可以通过操作文档树,来完成数据的获取、修改、删除等。

优点:

​ 文档在内存中加载, 允许对数据和结构做出更改

​ 访问是双向的,可以在任何时候在树中双向解析数据

缺点:

​ 文档全部加载在内存中 , 消耗资源大

3.JDOM解析

目的是成为Java特定文档模型,它简化与XML的交互并且比使用DOM实现更快。由于是第一 个Java特定模型,JDOM一直得到大力推广和促进。

JDOM文档声明其目的是“使用20%(或更少)的精力解决80%(或更多)Java/XML问题” (根据学习曲线假定为20%)

优点:

​ 使用具体类而不是接口,简化了DOM的API。

​ 大量使用了Java集合类,方便了Java开发人员。

缺点:

​ 没有较好的灵活性。

​ 性能不是那么优异。

4.DOM4J解析

它是JDOM的一种智能分支。将JDOM的缺点进行了处理,面向接口,更灵活,性能高。

它合并了许多超出基本XML文档表示的功能,包括集成的XPath 支持、XML Schema支持以及用于大文档或流化文档的基于事件的处理。

  • XPTH:快速找到所有节点

它还提供了构建文档表示的选项, DOM4J是一个非常优秀的Java XML API,具有性能优异、功能强大和极端易用使用的特点,同时它也是一 个开放源代码的软件。

目前许多开源项目中大量采用DOM4J,例如:Hibernate

3、DOM4J解析XML(掌握)

步骤:

  1. 引入jar文件 dom4j.jar
  2. 创建一个指向XML文件的输入流 FileInputStream fis = new FileInputStream(“xml文件的地址”);
  3. 创建一个XML读取工具对象 SAXReader sr = new SAXReader();
  4. 使用读取工具对象, 读取XML文档的输入流 , 并得到文档对象(树模型对象) Document doc = sr.read(fis);
  5. 通过文档对象,获取XML文档中的根元素对象 Element root = doc.getRootElement();

通过文档对象获取根节点。拿到根元素后,可以通过根元素操作一些方法,改变名称、内容、属性等。

1.文档对象 Document

指的是加载到内存的整个XML文档

常用方法:

  1. 通过文档对象, 获取XML文档中的根元素对象

    Element root = doc.getRootElement(); 
    
  2. 添加根节点

    Element root = doc.addElement("根节点名称");
    

2.元素对象 Element

指的是XML文档中的单个节点

常用方法:

  1. 获取节点名称

    String getName(); 
    
  2. 获取节点内容

    String getText(); 
    
  3. 设置节点内容

    String setText(); 
    
  4. 根据子节点的名称 , 获取匹配名称的第一个子节点对象.

    Element element(String 子节点名称); 
    
  5. 获取所有的子节点对象

    List elements(); 
    
  6. 获取节点的属性值

    String attributeValue(String 属性名称); 
    
  7. 获取子节点的内容

    String elementText(String 子节点名称); 
    
  8. 添加子节点

    Element addElement(String 子节点名称);
    
  9. 添加属性

    void addAttribute(String 属性名,String 属性值);
    

3.DOM4J解析XML案例

例1:解析本地文件:

/**
 * @author Elvira
 * @date 2020/10/18 17:55
 * @description
 */
public class Test1 
    public static void main(String[] args) throws IOException, DocumentException 
        //1.获取输入流,能拿到XML文件
        FileInputStream fis = new FileInputStream("src/wct/day19/Test1.xml");
        //2.创建XML读取对象
        SAXReader sr = new SAXReader();
        //3.读取并得到文档对象
        Document doc = sr.read(fis);
        //4.通过文档获取根元素
        Element root = doc.getRootElement();
        //5.解析元素:获取根元素的内容
        //获取姓名
        System.out.println(root.getName());
        fis.close();
    

  • 运行结果:

//获取节点内容
Element book = root.element("book");
Element name = book.element("name");
System.out.println(name.getText());
  • 运行结果:

循环打印:

List<Element> element = root.elements();
for (int i = 0; i < element.size(); i++) 
    Element book = element.get(i);
    System.out.println(book.attributeValue("id"));
    System.out.println(book.elementText("name"));
    System.out.println(book.elementText("info"));
    System.out.println("----------------------------");

  • 运行结果:

例2:解析网络文件

提供一个公共的API接口平台:聚合数据

URL url = new URL("http://apis.juhe.cn/mobile/get? phone="+phone+"&dtype=xml&key=9f3923e8f87f1ea50ed4ec8c39cc9253");phone中写自己的手机号,可以得到手机归属地。

网页中打开是这样:解析这个XML

/**
 * @author Elvira
 * @date 2020/10/18 19:22
 * @description
 */
public class Test2 
    public static void main(String[] args) throws IOException, DocumentException 
        String phone = "xxxxxxxxxxx";
        //1. 获取到XML资源的输入流
        URL url = new URL("http://apis.juhe.cn/mobile/get? phone="+phone+"&dtype=xml&key=9f3923e8f87f1ea50ed4ec8c39cc9253");
        URLConnection conn = url.openConnection();
        InputStream is = conn.getInputStream();
        //2. 创建一个XML读取对象
        SAXReader sr = new SAXReader();
        //3. 通过读取对象 读取XML数据,并返回文档对象
        Document doc = sr.read(is);
        //4. 获取根节点
        Element root = doc.getRootElement();
        //5. 解析内容
        String code = root.elementText("resultcode");
        if("200".equals(code))
            Element result = root.element("result");
            String province = result.elementText("province");
            String city = result.elementText("city");
            if(province.equals(city))
                System.out.println("手机号码归属地为:"+city);
            else
                System.out.println("手机号码归属地为:"+province+" "+city);
            
        else
            System.out.println("请输入正确的手机号码");
        
    

  • 运行结果:

4.DOM4J-XPATH解析XML

通过路径快速的查找一个或一组元素

  • 路径表达式:
  1. / : 从根节点开始查找

  2. == // : 从发起查找的节点位置 查找后代节点 ==

  3. . : 查找当前节点

  4. … : 查找父节点

  5. @ : 选择属性

    • 属性使用方式:

      [@属性名=‘值’]

      [@属性名>‘值’]

      [@属性名<‘值’]

      [@属性名!=‘值’]

    books: 路径: //book[@id=‘1’]//name

    books 
    	book id=1 
    		name 
    		info 
    	book id=2 
    		name 
    		info
    

使用步骤:

通过Node类的两个方法, 来完成查找:

(Node是 Document 与 Element 的父接口)

方法1.

//根据路径表达式, 查找匹配的单个节点 
Element e = selectSingleNode("路径表达式"); 

方法2.

List es = selectNodes("路径表达式");

案例:

/**
 * @author Elvira
 * @date 2020/10/18 19:39
 * @description
 */
public class Test3 
    public static void main(String[] args) throws IOException, DocumentException 
        String phone = "xxxxxxxxxxx";
        //1. 获取到XML资源的输入流
        URL url = new URL("http://apis.juhe.cn/mobile/get?phone="+phone+"&dtype=xml&key=9f3923e8f87f1ea50ed4ec8c39cc9253");
        URLConnection conn = url.openConnection();
        InputStream is = conn.getInputStream();
        //2. 创建一个XML读取对象
        SAXReader sr = new SAXReader();
        //3. 通过读取对象 读取XML数据,并返回文档对象
        Document doc = sr.read(is);
        Node node = doc.selectSingleNode("//company");
        System.out.println("运营商:"+node.getText());
        is.close();
    

  • 运行结果:

现在很多都是支持JSON传输数据,支持XML的非常少了。

4、Java生成XML(熟悉)

步骤:

  1. 通过文档帮助器 (DocumentHelper) , 创建空的文档对象

    Document doc = DocumentHelper.createDocument();
    
  2. 通过文档对象, 使用addElement向其中添加根节点

    Element root = doc.addElement("根节点名称"); 
    
  3. 通过根节点对象root , 丰富我们的子节点

    Element e = root.addElement("元素名称");
    
  4. 创建一个文件输出流,用于存储XML文件

    FileOutputStream fos = new FileOutputStream("要存储的位置"); 
    
  5. 将文件输出流, 转换为XML文档输出流

    XMLWriter xw = new XMLWriter(fos); 
    
  6. 写出文档

    xw.write(doc); 
    
  7. 释放资源

    xw.close();
    

案例:

/**
 * @author Elvira
 * @date 2020/10/18 19:52
 * @description
 */
public class Test4 
    public static void main(String[] args) throws IOException 
        //1. 通过文档帮助器, 创建空的文档对象
        Document doc = DocumentHelper.createDocument();
        //2. 向文档对象中, 加入根节点对象
        Element books = doc.addElement("books");
        //3. 向根节点中 丰富子节点
        for(int i = 0; i < 10; i++) 
            //向根节点中加入1000个book节点.
            Element book = books.addElement("book");
            //向book节点, 加入id属性
            book.addAttribute("id", 1+i+"");
            //向book节点中加入name和info节点
            Element name = book.addElement("name");
            Element info = book.addElement("info");
            name.setText("小公主"+i);
            info.setText("真可爱"+i);
        
        //4. 创建文件的输出流
        FileOutputStream fos = new FileOutputStream("G:\\\\books.xml");
        //5. 将文件输出流 , 转换为XML文档输出流
        XMLWriter xw = new XMLWriter(fos);
        //6. 写出XML文档
        xw.write(doc);
        //7. 释放资源
        xw.close();
        System.out.println("代码执行完毕");
    

  • 生成的XML结果:

5、XStream的使用(了解)

快速将Java中的对象转换为 XML字符串

使用步骤:

  1. 创建XStream 对象

    XStream x = new XStream(); 
    
  2. 修改类生成的节点名称 (默认节点名称为 包名.类名)

    x.alias("节点名称",类名.class); 
    
  3. 传入对象 , 生成XML字符串

    String xml字符串 = x.toXML(对象);
    
/**
 * @author Elvira
 * @date 2020/10/18 20:01
 * @description XStream将对象转为XML字符串
 */
public class Test5 
    public static void main(String[] args) 
        Person p = new Person();
        p.setAge(18);
        p.setName("小黄");

        XStream x = new XStream();
        x.alias("man", Person.class);
        String xml = x.toXML(p);
        System.out.println(xml);
    

  • 运行结果:

二、JSON

1、什么是JSON

简介

JSON:javascript Object Notation JS对象简谱,是一种轻量级的数据交换格式。

对象格式

表示:

一本书

​ 书名

​ 简介

  • JSON

"name":"小王子",
"info":"飞向外太空"

  • 一个对象由一个大括号表示

    括号中描述对象的属性

    通过键值对来描述对象的属性(可以理解为, 大括号中, 包含的是一个个的键值对)

    • 格式:

    ​ 键与值之间使用冒号连接,多个键值对之间使用逗号分隔 键值对的键应使用引号引住 (通常Java解析时,键不使用引号会报错,而JS能正确解析) 键值对的值,可以是JS中的任意类型的数据

数组格式

在JSON格式中可以与对象互相嵌套

[元素1,元素2...]


	"name":"宝宝",
	"age":18,
	"pengyou":["贝贝","晶晶","欢欢","迎迎","妮妮",
		"name":"福娃",
		"info":"北京欢迎你"
	],
	"happy":
	"name":"祝福",
	"length":"1000m"
	

2、JSON解析

JSON解析可以将Java中的对象快速的转换为 JSON格式的字符串将JSON格式的字符串,转换为Java的对象

1.Gson

谷歌的jar包

  • 将对象转换为JSON字符串
  1. 引入JAR包
  2. 在需要转换JSON字符串的位置编写如下代码即可: String json = new Gson().toJSON(要转换的对象);

案例:

/**
 * @author Elvira
 * @date 2020/10/18 21:45
 * @description
 */
public class Test6 
    public static void main(String[] args) 
        //1创建Gson对象
        Gson g = new Gson();
        //2转换
        Book b = new Book(1,"小王子","遨游外太空");
        String s = g.toJson(b);
        System.out.println(s);
    

  • 运行结果

  • 将JSON字符串转换为对象

  1. 引入JAR包
  2. 在需要转换Java对象的位置, 编写如下代码: 对象 = new Gson().fromJson(JSON字符串,对象类型.class);

案例:

/**
 * @author Elvira
 * @date 2020/10/18 21:56
 * @description
 */
public class Test7 
    public static void main(String[] args) 
        //1创建Gson对象
        Gson g = new Gson();

        String json = "\\"id\\":1,\\"name\\":\\"小朋友\\",\\"author\\":\\"朵朵 \\",\\"info\\":\\"你是不是有很多问号???\\",\\"price\\":198.0";
        Book book = g.fromJson(json, Book.class);以上是关于4-8《XML与JSON》——XML解析XMLSAXDOM4JXStreamJSONGsonFastjson的主要内容,如果未能解决你的问题,请参考以下文章

2 Go语言JSON与XML解析与表单操作

2 Go语言JSON与XML解析与表单操作

json数据解析与xml数据解析

在 iOS 中解析 JSON 与解析 XML

2 Go语言JSON与XML解析与表单操作

2 Go语言JSON与XML解析与表单操作