最详细的XML操作学习笔记

Posted java学习

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了最详细的XML操作学习笔记相关的知识,希望对你有一定的参考价值。

java学习

有完整的Java求职学习路线的学习资料

最详细的XML操作学习笔记

温馨提示

如果你是初学者,或者是自学者!你可以加小编微信(xxf960513)!小编可以给你学习上,工作上的一些建议以及可以给你(免费)提供学习资料!最重要我们还可以交个朋友!你在学习上有什么问题都可以加小编微信进行私聊!小编都会为你解答!

XML学习笔记1


本章目录描述:

1、xml文件的概述与应用场景

2、xml文件的组成部分&如何编写xml

3、xml的两种解析方式的原理

4、Dom4J开源工具的使用


第1章  xml的概述与如何编写xml文件

1.1  xml语言的概述

1.1.1xml介绍

xml语言是具有结构性的标记语言,  可以灵活的存储一对多的数据关系.

         举例:

最详细的XML操作学习笔记

         以上这种数据, 如果通过我们学习的集合来存储的话, 需要通过多个集合的嵌套使用.

         那么很显然, 数据存储的过程就非常麻烦, 但是我们今天所学习的xml文件就可以很简单的存储这种一对多的数据

         至于怎样存储, 我们稍后会详细讲解, 目前需要掌握的是关于xml的使用场景

                  用来存储一对多的数据

         另外, xml还有一些其他的应用方面:

         之前学习过properties配置文件, 通过这种配置文件, 可以使代码的编写更加灵活.

           但是这种配置文件也只能存储一个键值对的映射关系, 如果需要存储多个呢?

           没错, 可以使用xml , 所以xml的另一方面应用就展示出来了

           用来当做配置文件存储数据

1.1.2问题: xml文件是用来做什么的?

核心思想:

答:存储数据

延伸问题: xml是怎样存储数据的?

答:以标签的形式存储 

例:  <name>Jack</name>

1.2 xml的文档声明

1.2.1Xml文件的组成部分

文档声明

元素

元素的属性

注释

CDATA

特殊字符

处理指令(PI:ProcessingInstruction):了解

 绿色标注的内容:不作为掌握,了解即可

1.2.2文档声明

什么是文档声明?

         在编写XML文档时,需要先使用文档声明来声明XML文档。且必须出现在文档的第一行

         这就好比我们在写java文件的时候需要声明class一样, 就是个硬性的规定.

如何编写文档声明?

    <?xml version='1.0'encoding='UTF-8'?>

    xml表示标签的名字

    version表示当前文件的版本号

    encoding表示当前编码, 需要跟文件的编码产生对应关系

    ps:standalone表示标记此文档是否独立 了解即可

1.3  xml的元素

1.3.1什么是元素? 元素该如何编写?

1: xml中的元素其实就是一个个的标签
   2: 标签分为两种
            a: 包含标签体
                理解: 简括号全部成对儿出现, 所有的数据都用一对儿简括号存储
                :
                    <student>
                        <name>zhangsan</name>
                        <age>18</age>
                    </student>
            b: 不包含标签体
                理解: 只有最外层的一个简括号,括号用/标识结束, 内部的数据都用属性来编写
                    <student 
                        name="zhangsan"
                        age="18"
                    />
    两种方式都需要掌握, 但是第二种编写起来会更加方便

1.3.2标签(元素的书写规范)

严格区分大小写;<p><P>
只能以字母或下划线开头;abc _abc

不能以xml(XMLXml)开头----W3C保留日后使用;

名称字符之间不能有空格或制表符;

名称字符之间不能使用冒号 : (有特殊用途)

1.3.3元素中属性的注意事项

一个元素可以有多个属性,每个属性都有它自己的名称和取值

属性值一定要用引号(单引号或双引号)引起来。

属性名称的命名规范与元素的命名规范相

元素中的属性是不允许重复的

在XML技术中,标签属性所代表的信息也可以被改成用子元素的形式来描述
 例如:

<?xml version="1.0"encoding="UTF-8"?>

<students>

    <student name="zhangsan"age="18"/>

    <student>

        <name>zhangsan</name>

        <age>18</age>

    </student>

</students>

1.4 xml的注释

1.4.1格式编写

格式:

         <--被注释的内容 -- >

1.4.2注意事项

注意: 注释不能嵌套定义

1.5 xml的其他组成部分

1.5.1引入CDATA

为什么要使用CDATA区域?

         如果我们在标签中写入的内容, 想要带有标签的标记符号的话, 就需要对这段内容进行转义

         就好比java中的打印语句, 想要打印出这个字符就必须用/进行转义.

         标签也是一样, 想要将<itheima>当做内容存储的话, 就需要对他进行转义.

如何转义?

最详细的XML操作学习笔记

注意:

         这种转移可以达到效果, 但是如果操作的数据过多, 编写起来会非常痛苦, 所以, 可以使用CDATA区来解决此问题

 

1.5.2实例代码

<?xml version="1.0"encoding="UTF-8"?>

<!--

    如果有一个包含标签体的标签,

    他的标签体是一个普通文本,不是子标签,

    而普通文本中包含了一个标签,那这样可以吗?

-->

<students>

    <student>

        <name>zhangsan</name>

        <url>

            <![CDATA[

                <itheima>www.javazysq.com</itheima>

                <itcast>www.javazysq.cn</itcast>

            ]]>

        </url>

    </student>

    <student>

        <name>zhangsan</name>

        <url>

            &lt;javaxxf&gt;www.javaxxf.com&lt;/javaxxf&gt;

        </url>

    </student>

</students>

1.6 DTD的入门案例

1.6.1为什么要有约束 (DTD)?

XML都是用户自定义的标签,若出现小小的错误,软件程序将不能正确地获取文件中的内容而报错。(如:Tomcat)

XML技术中,可以编写一个文档来约束一个XML的书写规范,这个文档称之为约束

1.6.2如何使用DTD约束文件?

  1. 编写DTD文件

<?xmlversion="1.0" encoding="UTF-8"?>

<!ELEMENT书架(+)>

    <!ELEMENT (书名,作者,售价)>

    <!ELEMENT 书名 (#PCDATA)>

    <!ELEMENT 作者 (#PCDATA)>

    <!ELEMENT 售价 (#PCDATA)>

  1. xml文件中引入DTD文件

<!DOCTYPE书架 SYSTEM "book.dtd">

         引入了写好的DTD文件后, 格式就必须跟DTD文件保持一致

1.7 DTD的细节

1.7.1语法细节

DTD文档中使用ELEMENT关键字来声明一个XML元素。

语法:<!ELEMENT 元素名称使用规则>

使用规则:

1、(#PCDATA):指示元素的主体内容只能是普通的文本.(Parsed Character Data)

2、EMPTY:用于指示元素的主体为空。比如<br/>

3、 ANY:用于指示元素的主体内容为任意类型。

4、(子元素):指示元素中包含的子元素

•       定义子元素及描述它们的关系:

如果子元素用逗号分开,说明必须按照声明顺序去编写XML文档。

•       如: <!ELEMENTFILE (TITLE,AUTHOR,EMAIL)

如果子元素用"|"分开,说明任选其一。

•       如:<!ELEMENTFILE (TITLE|AUTHOR|EMAIL)

 用+、*、?来表示元素出现的次数

如果元素后面没有+*?:表示必须且只能出现一次

+:表示至少出现一次,一次或多次

*:表示可有可无,零次、一次或多次

?:表示可以有也可以无,有的话只能有一次。零次或一次

1.7.2定义属性

       DTD文档中使用ATTLIST关键字来为一个元素声明属性。

       语法:

                  <!ATTLIST 元素名

       属性名1 属性值类型 设置说明

      属性名2 属性值类型 设置说明

                          …

                  >

       属性值类型:

       CDATA:表示属性的取值为普通的文本字符串

       ENUMERATED (DTD没有此关键字):表示枚举,只能从枚举列表中任选其一,如(鸡肉|牛肉|猪肉|鱼肉)

       ID:表示属性的取值不能重复

       设置说明

       #REQUIRED:表示该属性必须出现

       #IMPLIED:表示该属性可有可无

       #FIXED:表示属性的取值为一个固定值。语法:#FIXED "固定值"

直接值:表示属性的取值为该默认值

1.7.3实例代码1

<!ATTLIST 商品
       类别 CDATA #REQUIRED
       颜色 CDATA #IMPLIED
>

<?xml version = "1.0"encoding="GB2312" standalone="yes"?>

    <商品 类别="服装"颜色="黄色" />

1.7.4实例代码2

<?xml version = "1.0" encoding="GB2312"standalone="yes"?>
<!DOCTYPE 购物篮 [
 <!ELEMENT 购物篮(肉+)>
   <!ELEMENT肉 EMPTY>
   <!ATTLIST肉 品种 ( 鸡肉 | 牛肉 | 猪肉 | 鱼肉 ) "鸡肉">
]>

<购物篮>
   < 品种="鱼肉"/>
   < 品种="牛肉"/>
   </>
</购物篮>
1.8 Schema的概述

1.8.1概述

Schema约束自身就是一个XML文件,但它的扩展名通常为.xsd

一个XML Schema文档通常称之为模式文档(约束文档),遵循这个文档书写的xml文件称之为实例文档。

XML Schema名称空间支持得非常好

理解:

 名称空间: 相当于package                   

 约束文档: 编写好的Person类           

 实例文档: 通过Person类创建对象

1.9 Schema入门案例

1.9.1实例代码

约束文档:

<?xml version='1.0' encoding='UTF-8' ?>
<xs:schemaxmlns:xs='http://www.w3.org/2001/XMLSchema'
                   //标准的名称空间
                   targetNamespace='http://www.javaxxf.com'
                      //将该schema文档绑定到http://www.javaxxf.com名称空间
               >
   <xs:elementname='书架' >
       <xs:complexType>
           <xs:sequencemaxOccurs='unbounded' >
               <xs:elementname='书' >
                  <xs:complexType>
                      <xs:sequence>
                          <xs:element name='书名' type='xs:string' />
                          <xs:elementname='作者'type='xs:string' />
                          <xs:elementname='售价'type='xs:string' />
                      </xs:sequence>
                  </xs:complexType>
               </xs:element>
           </xs:sequence>
       </xs:complexType>
   </xs:element>
</xs:schema>

实例文档:

<?xml version="1.0"encoding="UTF-8"?>
<javaxxf:书架 xmlns:javaxxf="http://www.javaxxf.com"
               xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
      xsi:schemaLocation="http://www.javaxxf.combook.xsd">

   <javaxxf:书>
       <javaxxf:书名>javascript网页开发</javaxxf:书名>
       <javaxxf:作者>张孝祥</javaxxf:作者>
       <javaxxf:售价>28.00元</javaxxf:售价>
   </javaxxf:书>
</javaxxf:书架>

名称空间:

<javaxxf:书架 xmlns:javaxxf="http://www.javaxxf.com"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.javaxxf.combook.xsd">

1.9.2使用默认名称空间

       基本格式:

         xmlns="URI" 

       举例:

<书架 xmlns="http://www.it315.org/xmlbook/schema"
  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.it315.org/xmlbook/schemabook.xsd">

                 <>
                 <书名>JavaScript网页开发</书名>
                 <作者>张孝祥</作者>
                 <售价>28.00元</售价>
                 </>
        <书架>

第2章  解析xml文件
1.1     XML解析的两种方式

1.1.1DOM方式和SAX方式

DOMDocumentObject Model,文档对象模型。这种方式是W3C推荐的处理XML的一种方式。

SAXSimple APIfor XML。这种方式不是官方标准,属于开源社区XML-DEV,几乎所有的XML解析器都支持它。

XML解析开发包
JAXPSUN公司推出的解析标准实现。
Dom4J是开源组织推出的解析开发包。(牛,大家都在用,包括SUN公司的一些技术的实现都在用。)
Dom for java four==Log4j 

1.1.2总结:

DOM: 将整棵树一口气全部加载到内存当中, 我们可以非常方便的操作任意的标签和属性.但是, 如果整棵树特别大的时候, 会出现内存溢出的问题

节点: 标签、属性、文本、甚至是换行都称之为节点

SAX: 一个节点一个节点的进行解析(暂不掌握)

1.2  Dom4J的方法概述

*Dom4J的常用方法:

 * Document

 *   Element getRootElement() :获取根元素对象(根标签)

 * Element

 *  List elements() :获取所有的子元素

 *  List elements(String name):根据指定的元素名称来获取相应的所有的子元素

 *  Element element(String name):根据指定的元素名称来获取子元素对象,如果元素名称重复,则获取第一个元素

 *  StringelementText(Stringname) :根据指定的子元素名称,来获取子元素中的文本

 *  StringgetText():获取当前元素对象的文本

 *  void setText(String text):设置当前元素对象的文本

 *  StringattributeValue(Stringname):根据指定的属性名称获取其对应的值

 *  public Element addAttribute(String name,Stringvalue):根据指定的属性名称和值进行添加或者修改BeanUtils的常用方法

1.3 Dom4J的案例 (获取).

1.3.1功能分析

//1、得到某个具体的节点内容:打印"郑州"

//2、遍历所有元素节点:打印他们的元素名称。

     Ps:因为不知道有多少个元素节点, 所以需要递归.

1.3.2案例代码

private static void method2() throwsException {
       //2、遍历所有元素节点:打印他们的元素名称。
       //获取根元素
       Document document = Dom4JUtils.getDocument();
       Element rootElement = document.getRootElement();
       treeWalk(rootElement);
   }
   public static void treeWalk(Element element) {
       //输出元素的名称
       System.out.println(element.getName());
       //获取指定元素的所有子元素
       List<Element>es = element.elements();
       for (Element e: es) {
           treeWalk(e);
       }
   }
   private static void method() throws Exception {
       //1、得到某个具体的节点内容:打印"郑州"
       Document document = Dom4JUtils.getDocument();
       //获取根元素
       Element rootElement = document.getRootElement();
       //获取根元素下的所有子元素
       List<Element>elements = rootElement.elements();
       //根据索引获取第一个City元素
       Element cityElement = elements.get(0);
       //根据子元素的名称来获取子元素的文本
       Stringtext = cityElement.elementText("Name");
       System.out.println(text);
   }

 

<?xml version="1.0"encoding="UTF-8"?>
<State Code="37" Name="河南"
   description="郑州" GDP="99999亿">

 <City>
   <Name>郑州</Name>
   <Region>高薪区</Region>
 </City>
 <City>三门峡</City>
 <City>洛阳</City>
 <City>安阳</City>
 <City>南阳</City>
</State>
1.4  Dom4J的案例(删除和修改)

1.4.1功能分析

//3、修改某个元素节点的主体内容:信阳-->安阳

//6、删除指定元素节点:删除元素开封

   注意: 调用方法完毕, 仅仅是在内存中进行了修改, 需要用到OutputFormatXMLWirter两个类配合使用

将数据写入到文件

1.4.2实例代码

public static void write2XML(Document document) throwsIOException {
       OutputFormatformat = OutputFormat.createPrettyPrint();
       //format.setEncoding("UTF-8");//默认的编码就是UTF-8
       XMLWriterwriter = newXMLWriter( new FileOutputStream("src/com/itheima_04/city.xml"), format );
       writer.write(document );
   }
private static void method3() throwsException, IOException {
       //3、修改某个元素节点的主体内容:信阳-->安阳
       Documentdocument = Dom4JUtils.getDocument();
       //获取根元素
       ElementrootElement = document.getRootElement();
       //获取根元素下的所有子元素
       List<Element>es = rootElement.elements();
       //根据索引可以获取指定的元素
       ElementcityElement = es.get(3);
       //修改文本
       cityElement.setText("安阳");
       //写回文件
       Dom4JUtils.write2XML(document);
   }
private static void method4() throwsException, IOException {
       //6、删除指定元素节点:删除元素开封
       Document document = Dom4JUtils.getDocument();
       //获取根元素
       Element rootElement = document.getRootElement();
       //获取根元素下的所有子元素
       List<Element>es = rootElement.elements();
       ElementcityElement = es.get(1);
       //无法自杀,找他爹
       ElementparentElement = cityElement.getParent();
       parentElement.remove(cityElement);
       //写回文件
       Dom4JUtils.write2XML(document);
   }
1.5  Dom4J的案例(添加)

1.5.1功能分析

     //4、向指定元素节点中增加子元素节:添加一个新城市<City>南阳</City>

     //5、向指定元素节点上增加同级元素节点:在洛阳前面,添加一个<City>三门峡</City>

1.5.2案例代码

private static void method5() throwsException, IOException {
       //4、向指定元素节点中增加子元素节:添加一个新城市<City>南阳</City>
       Document document = Dom4JUtils.getDocument();
       //获取根元素
       Element rootElement = document.getRootElement();
       //添加元素
       Element cityElement = rootElement.addElement("City");
       //设置文本
       cityElement.setText("南阳");
       //写回文件
       Dom4JUtils.write2XML(document);
}

private static void method6() throwsException, IOException {
       //5、向指定元素节点上增加同级元素节点:在洛阳前面,添加一个<City>三门峡</City>
       //创建一个新的元素对象
       Element cityElement = DocumentHelper.createElement("City");
       //设置文本
       cityElement.setText("三门峡");  
       Document document = Dom4JUtils.getDocument();
       //获取根元素
       Element rootElement = document.getRootElement();
       //获取根元素下所有的子元素
       List<Element>es = rootElement.elements();
       //将新的元素添加到子元素列表中
       es.add(1, cityElement);
       //写会文件
       Dom4JUtils.write2XML(document);
}
1.6 Dom4J的案例(属性获取和添加)

1.6.1功能分析

     //7、操作XML文件属性:打印State的Name

     //8、添加属性:State: GDP="99999亿"

1.6.2案例代码

private static void method7() throwsException {
       //7、操作XML文件属性:打印State的Name
       Document document = Dom4JUtils.getDocument();
       //获取根元素
       Element rootElement = document.getRootElement();
       //根据属性名称获取值
       Stringvalue = rootElement.attributeValue("Name");
       System.out.println(value);
}
public static void main(String[] args)throws Exception  {
       //7、操作XML文件属性:打印State的Name
       //8、添加属性:State: GDP="99999亿"
       Document document = Dom4JUtils.getDocument();
       //获取根元素
       Element rootElement = document.getRootElement();
       //添加新的属性和对应的值
       rootElement.addAttribute("GDP","99999亿");
       //写回文件
       Dom4JUtils.write2XML(document);
}


记得分享给身边有需要的人

小编微信:xxf960326

推荐阅读目录

⊙ 

⊙  

   

 

推荐Java学习小程序


小编的微信

以上是关于最详细的XML操作学习笔记的主要内容,如果未能解决你的问题,请参考以下文章

史上最详细Ajax学习笔记

学习笔记:python3,代码片段(2017)

MybatisSpringSpringMVC 最详细学习路线 ❤️

MybatisSpringSpringMVC 最详细学习路线 ❤️

MybatisSpringSpringMVC 最详细学习路线 ❤️

最全最详细publiccms常用的代码片段