xml

Posted 2020-10-21 Zennon

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了xml相关的知识，希望对你有一定的参考价值。

XML:
XML全称为Extensible Markup Language，意思是可扩展的标记语言。
XML 被设计用来传输和存储数据。
1.XML的作用:
存放数据;
配置文件;(用的较多)

2.1 XML文档声明格式：
<?xml version="1.0" encoding="UTF-8"?>
1.文档声明必须为<?xml开头，以?>结束；
2.文档声明必须从文档的0行0列位置开始；
3.文档声明只有2个属性：
a)version：指定XML文档版本。必须属性，因为我们不会选择1.1，只会选择1.0；
b)encoding：指定当前文档的编码。可选属性，默认值是utf-8；
2.2 元素
?元素 element

格式:
<bean>bbb</bean>
<开始标签>元素体</结束标签>
1.元素是XML文档中最重要的组成部分，
2.普通元素的结构开始标签、元素体、结束标签组成。例如：<hello>大家好</hello>
3.元素体：元素体可以是元素，也可以是文本，例如：<b><a>你好</a></b>
4.空元素：空元素只有开始标签，而没有结束标签，但元素必须自己闭合，例如：<c/>
5.元素命名：
a)区分大小写
b)不能使用空格，不能使用冒号:
c)不建议以XML、xml、Xml开头
6.格式化良好的XML文档，必须只有一个根元素。

2.3属性
?属性
格式:
<bean id=”” className=””>
<开始标签属性名1=”属性值1” 属性名2=”属性值2”>bb</结束标签>

1.属性是元素的一部分，它必须出现在元素的开始标签中
2.属性的定义格式：属性名=属性值，其中属性值必须使用单引或双引
3.一个元素可以有0~N个属性，但一个元素中不能出现同名属性
4.属性名不能使用空格、冒号等特殊字符，且必须以字母开头
目前我们只是了解了XML文件的格式而已,对于未来的使用XML文件,我们更关注的是”属性值”.

2.4注释
XML的注释，以“”结束。注释内容会被XML解析器忽略！

2.5转义字符
?转义字符
因为很多符号已经被XML文档结构所使用，所以在元素体或属性值中想使用这些符号就必须使用转义字符，例如：“<”、“>”、“’”、“””、“&”。

格式:
&开头;结尾,中间加英文表示
例如: < 表示 <
> 表示 >
& 表示 &
2.6CDATA
?CDATA区
格式:
<![CDATA[
任意内容
]]>
当大量的转义字符出现在xml文档中时，会使xml文档的可读性大幅度降低。这时如果使用CDATA段就会好一些。相当于CDATA中的内容就是普通字符串.通常这里面可能写大量的数据,方便阅读.
在CDATA段中出现的“<”、“>”、“””、“’”、“&”，都无需使用转义字符。这可以提高xml文档的可读性。
在CDATA段中不能包含“]]>”，即CDATA段的结束定界符。

3.XML约束
在XML技术里，可以编写一个文档来约束一个XML文档的书写规范，这称之为XML约束。
常见的xml约束：DTD、Schema
目的: 通过约束文档,可以编写出符合约束格式的XML文档.

3.1DTD约束
3.1.1什么是DTD
DTD（Document Type Definition），文档类型定义，用来约束XML文档。规定XML文档中元素的名称，子元素的名称及顺序，元素的属性等。

3.1.2DTD重点要求
开发中，我们很少自己编写DTD约束文档，通常情况我们都是通过框架提供的DTD约束文档，编写对应的XML文档。常见框架使用DTD约束有：struts2、hibernate等

3.2Schema约束
3.2.1什么是Schema
XML Schema 是基于 XML 的 DTD 替代者。 XML Schema 描述 XML 文档的结构。 XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。
Schema是新的XML文档约束；
Schema要比DTD强大很多，是DTD 替代者；
Schema本身也是XML文档，但Schema文档的扩展名为xsd，而不是xml。
Schema 功能更强大，数据类型更完善
Schema 支持命名空间

3.2.2Schema重点要求
与DTD一样，要求可以通过schema约束文档编写xml文档。常见框架使用schema的有：Spring等

3.2.4命名空间（语法）
3.2.4.1什么是命名空间
如果一个XML文档中使用多个Schema文件，而这些Schema文件中定义了相同名称的元素时就会出现名字冲突。这就像一个Java文件中使用了import java.util.*和import java.sql.*时，在使用Date类时，那么就不明确Date是哪个包下的Date了。
总之名称空间就是用来处理元素和属性的名称冲突问题，与Java中的包是同一用途。如果每个元素和属性都有自己的名称空间，那么就不会出现名字冲突问题，就像是每个类都有自己所在的包一样，那么类名就不会出现冲突。

3.2.4.2约束文档和XML关系
当W3C提出Schema约束规范时，就提供“官方约束文档”。我们通过官方文档，必须“自定义schema 约束文档”，开发中“自定义文档”由框架编写者提供。我们提供“自定义文档”限定，编写出自己的xml文档。

4.dom4j解析
4.1XML解析概述
当将数据存储在XML后，我们就希望通过程序获得XML的内容。如果我们使用Java基础所学习的IO知识是可以完成的，不过你需要非常繁琐的操作才可以完成，且开发中会遇到不同问题（只读、读写）。人们为不同问题提供不同的解析方式，并提交对应的解析器，方便开发人员操作XML。

4.2解析方式和解析器
?开发中比较常见的解析方式有三种，如下：
1.DOM：要求解析器把整个XML文档装载到内存，并解析成一个Document对象。
a)优点：元素与元素之间保留结构关系，故可以进行增删改查操作。
b)缺点：XML文档过大，可能出现内存溢出显现。
2.SAX：是一种速度更快，更有效的方法。它逐行扫描文档，一边扫描一边解析。并以事件驱动的方式进行具体解析，每执行一行，都将触发对应的事件。（了解）
a)优点：处理速度快，可以处理大文件
b)缺点：只能读，逐行后将释放资源。
3.PULL：android内置的XML解析方式，类似SAX。（了解）

?解析器：就是根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐，为了方便开发人员，有提供易于操作的解析开发包。

?常见的解析开发包：
?JAXP：sun公司提供支持DOM和SAX开发包
?JDom：dom4j兄弟
?jsoup：一种处理html特定解析开发包
?dom4j：比较常用的解析开发包，hibernate底层采用。

1.4.4API使用
如果需要使用dom4j，必须导入jar包。

dom4j 必须使用核心类SaxReader加载xml文档获得Document，通过Document对象获得文档的根元素，然后就可以操作了。

解析步骤:
1.创建核心类 SAXReader
2.获取Document 对象
3.获取根元素
4.获取所有子元素.
5.获取子元素的属性property

常用API如下：
1.SaxReader对象
a)read(…) 加载执行xml文档
2.Document对象
a)getRootElement() 获得根元素
3.Element对象
a)elements(…) 获得指定名称的所有子元素。可以不指定名称
b)element(…) 获得指定名称第一个子元素。可以不指定名称
c)getName() 获得当前元素的元素名
d)attributeValue(…) 获得指定属性名的属性值
e)elementText(…) 获得指定名称子元素的文本值
f)getText() 获得当前元素的文本内容

<?xml version="1.0" encoding="UTF-8"?>
<beans>
<bean id="001" className="cn.itcast.demo.User">
<property name="user" value="jack">文本1</property>
<property name="user" value="rose">文本2</property>
</bean>
<bean id="002" className="cn.itcast.demo.Admin">
<property name="user" value="admin">文本3</property>
<property name="user" value="write">文本4</property>
</bean>
</beans>


package cn.itcast.demo02;

import java.util.List;

import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

public class Demo02 {
public static void main(String[] args) throws DocumentException {
// 1.创建dom4j核心类对象SAXReader
SAXReader sax = new SAXReader();
// 2.使用SAXReader中的方法read,读取xml,把xml文档加载到内存中,生成Document对象
Document docu = sax.read("beans.xml");
// 3.使用Document对象中的方法getRootElement获取根元素beans元素(Element)
Element rootElement = docu.getRootElement();
System.out.println(rootElement.getName());
// 4.使用beansElment元素中的方法elements获取beans元素下边的所有子元素bean;多个bean元素存储在一个List集合
List<Element> beanElementList = rootElement.elements();
// 5.遍历存储bean元素的List集合,获取每一个beanElement
for (Element beanElement : beanElementList) {
System.out.println("\t" + beanElement.getName());
// 6.使用Element中的方法attributeValue根据属性的名字,获取bean元素上属性的值
String id = beanElement.attributeValue("id");
String className = beanElement.attributeValue("className");

System.out.println("\t\tbean元素上的属性id:" + id);
System.out.println("\t\tbean元素上的属性className:" + className);
// 7.使用beanElement中的方法elements获取bean元素下边的所有子元素property;多个property元素存储在一个List集合
List<Element> propertyElementList = beanElement.elements();
// 8.遍历存储property元素的List集合,获取每一个propertyElement
for (Element propertyElement : propertyElementList) {
System.out.println("\t\t\t" + propertyElement.getName());
// 9.使用Element中的方法attributeValue根据属性的名字,获取property元素上属性的值
String name = propertyElement.attributeValue("name");
String value = propertyElement.attributeValue("value");

System.out.println("\t\t\t\tproperty元素上的属性name:" + name);
System.out.println("\t\t\t\tproperty元素上的属性value:" + value);
// 10.使用Element中的方法getText,获取property元素上文本内容
String text = propertyElement.getText();
System.out.println("\t\t\t\tproperty元素上的文本:" + text);
}
}
}
}

以上是关于xml的主要内容，如果未能解决你的问题，请参考以下文章