XML:
XML全称为Extensible Markup Language,意思是可扩展的标记语言。
XML 被设计用来传输和存储数据。
1.XML的作用:
存放数据;
配置文件;(用的较多)
2.1 XML文档声明格式:
<?xml version="1.0" encoding="UTF-8"?>
1.文档声明必须为<?xml开头,以?>结束;
2.文档声明必须从文档的0行0列位置开始;
3.文档声明只有2个属性:
a)version:指定XML文档版本。必须属性,因为我们不会选择1.1,只会选择1.0;
b)encoding:指定当前文档的编码。可选属性,默认值是utf-8;
2.2 元素
?元素 element
格式:
<bean>bbb</bean>
<开始标签>元素体</结束标签>
1.元素是XML文档中最重要的组成部分,
2.普通元素的结构开始标签、元素体、结束标签组成。例如:<hello>大家好</hello>
3.元素体:元素体可以是元素,也可以是文本,例如:<b><a>你好</a></b>
4.空元素:空元素只有开始标签,而没有结束标签,但元素必须自己闭合,例如:<c/>
5.元素命名:
a)区分大小写
b)不能使用空格,不能使用冒号:
c)不建议以XML、xml、Xml开头
6.格式化良好的XML文档,必须只有一个根元素。
2.3属性
?属性
格式:
<bean id=”” className=””>
<开始标签 属性名1=”属性值1” 属性名2=”属性值2”>bb</结束标签>
1.属性是元素的一部分,它必须出现在元素的开始标签中
2.属性的定义格式:属性名=属性值,其中属性值必须使用单引或双引
3.一个元素可以 有0~N个属性,但一个元素中不能出现同名属性
4.属性名不能使用空格、冒号等特殊字符,且必须以字母开头
目前我们只是了解了XML文件的格式而已,对于未来的使用XML文件,我们更关注的是”属性值”.
2.4注释
XML的注释,以“<!--”开始,以“-->”结束。注释内容会被XML解析器忽略!
2.5转义字符
?转义字符
因为很多符号已经被XML文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符,例如:“<”、“>”、“’”、“””、“&”。
格式:
&开头;结尾,中间加英文表示
例如: < 表示 <
> 表示 >
& 表示 &
2.6CDATA
?CDATA区
格式:
<![CDATA[
任意内容
]]>
当大量的转义字符出现在xml文档中时,会使xml文档的可读性大幅度降低。这时如果使用CDATA段就会好一些。相当于CDATA中的内容就是普通字符串.通常这里面可能写大量的数据,方便阅读.
在CDATA段中出现的“<”、“>”、“””、“’”、“&”,都无需使用转义字符。这可以提高xml文档的可读性。
在CDATA段中不能包含“]]>”,即CDATA段的结束定界符。
3.XML约束
在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束。
常见的xml约束:DTD、Schema
目的: 通过约束文档,可以编写出符合约束格式的XML文档.
3.1DTD约束
3.1.1什么是DTD
DTD(Document Type Definition),文档类型定义,用来约束XML文档。规定XML文档中元素的名称,子元素的名称及顺序,元素的属性等。
3.1.2DTD重点要求
开发中,我们很少自己编写DTD约束文档,通常情况我们都是通过框架提供的DTD约束文档,编写对应的XML文档。常见框架使用DTD约束有:struts2、hibernate等
3.2Schema约束
3.2.1什么是Schema
XML Schema 是基于 XML 的 DTD 替代者。 XML Schema 描述 XML 文档的结构。 XML Schema 语言也称作 XML Schema 定义(XML Schema Definition,XSD)。
Schema是新的XML文档约束;
Schema要比DTD强大很多,是DTD 替代者;
Schema本身也是XML文档, 但Schema文档的扩展名为xsd,而不是xml。
Schema 功能更强大,数据类型更完善
Schema 支持命名空间
3.2.2Schema重点要求
与DTD一样,要求可以通过schema约束文档编写xml文档。常见框架使用schema的有:Spring等
3.2.4命名空间(语法)
3.2.4.1什么是命名空间
如果一个XML文档中使用多个Schema文件,而这些Schema文件中定义了相同名称的元素时就会出现名字冲突。这就像一个Java文件中使用了import java.util.*和import java.sql.*时,在使用Date类时,那么就不明确Date是哪个包下的Date了。
总之名称空间就是用来处理元素和属性的名称冲突问题,与Java中的包是同一用途。如果每个元素和属性都有自己的名称空间,那么就不会出现名字冲突问题,就像是每个类都有自己所在的包一样,那么类名就不会出现冲突。
3.2.4.2约束文档和XML关系
当W3C提出Schema约束规范时,就提供“官方约束文档”。我们通过官方文档,必须“自定义schema 约束文档”,开发中“自定义文档”由框架编写者提供。我们提供“自定义文档”限定,编写出自己的xml文档。
4.dom4j解析
4.1XML解析概述
当将数据存储在XML后,我们就希望通过程序获得XML的内容。如果我们使用Java基础所学习的IO知识是可以完成的,不过你需要非常繁琐的操作才可以完成,且开发中会遇到不同问题(只读、读写)。人们为不同问题提供不同的解析方式,并提交对应的解析器,方便开发人员操作XML。
4.2解析方式和解析器
?开发中比较常见的解析方式有三种,如下:
1.DOM:要求解析器把整个XML文档装载到内存,并解析成一个Document对象。
a)优点:元素与元素之间保留结构关系,故可以进行增删改查操作。
b)缺点:XML文档过大,可能出现内存溢出显现。
2.SAX:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件驱动的方式进行具体解析,每执行一行,都将触发对应的事件。(了解)
a)优点:处理速度快,可以处理大文件
b)缺点:只能读,逐行后将释放资源。
3.PULL:android内置的XML解析方式,类似SAX。(了解)
?解析器:就是根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。
?常见的解析开发包:
?JAXP:sun公司提供支持DOM和SAX开发包
?JDom:dom4j兄弟
?jsoup:一种处理html特定解析开发包
?dom4j:比较常用的解析开发包,hibernate底层采用。
1.4.4API使用
如果需要使用dom4j,必须导入jar包。
dom4j 必须使用核心类SaxReader加载xml文档获得Document,通过Document对象获得文档的根元素,然后就可以操作了。
解析步骤:
1.创建核心类 SAXReader
2.获取Document 对象
3.获取根元素
4.获取所有子元素.
5.获取子元素的属性property
常用API如下:
1.SaxReader对象
a)read(…) 加载执行xml文档
2.Document对象
a)getRootElement() 获得根元素
3.Element对象
a)elements(…) 获得指定名称的所有子元素。可以不指定名称
b)element(…) 获得指定名称第一个子元素。可以不指定名称
c)getName() 获得当前元素的元素名
d)attributeValue(…) 获得指定属性名的属性值
e)elementText(…) 获得指定名称子元素的文本值
f)getText() 获得当前元素的文本内容
<?xml version="1.0" encoding="UTF-8"?> <beans> <bean id="001" className="cn.itcast.demo.User"> <property name="user" value="jack">文本1</property> <property name="user" value="rose">文本2</property> </bean> <bean id="002" className="cn.itcast.demo.Admin"> <property name="user" value="admin">文本3</property> <property name="user" value="write">文本4</property> </bean> </beans> package cn.itcast.demo02; import java.util.List; import org.dom4j.Attribute; import org.dom4j.Document; import org.dom4j.DocumentException; import org.dom4j.Element; import org.dom4j.io.SAXReader; public class Demo02 { public static void main(String[] args) throws DocumentException { // 1.创建dom4j核心类对象SAXReader SAXReader sax = new SAXReader(); // 2.使用SAXReader中的方法read,读取xml,把xml文档加载到内存中,生成Document对象 Document docu = sax.read("beans.xml"); // 3.使用Document对象中的方法getRootElement获取根元素beans元素(Element) Element rootElement = docu.getRootElement(); System.out.println(rootElement.getName()); // 4.使用beansElment元素中的方法elements获取beans元素下边的所有子元素bean;多个bean元素存储在一个List集合 List<Element> beanElementList = rootElement.elements(); // 5.遍历存储bean元素的List集合,获取每一个beanElement for (Element beanElement : beanElementList) { System.out.println("\t" + beanElement.getName()); // 6.使用Element中的方法attributeValue根据属性的名字,获取bean元素上属性的值 String id = beanElement.attributeValue("id"); String className = beanElement.attributeValue("className"); System.out.println("\t\tbean元素上的属性id:" + id); System.out.println("\t\tbean元素上的属性className:" + className); // 7.使用beanElement中的方法elements获取bean元素下边的所有子元素property;多个property元素存储在一个List集合 List<Element> propertyElementList = beanElement.elements(); // 8.遍历存储property元素的List集合,获取每一个propertyElement for (Element propertyElement : propertyElementList) { System.out.println("\t\t\t" + propertyElement.getName()); // 9.使用Element中的方法attributeValue根据属性的名字,获取property元素上属性的值 String name = propertyElement.attributeValue("name"); String value = propertyElement.attributeValue("value"); System.out.println("\t\t\t\tproperty元素上的属性name:" + name); System.out.println("\t\t\t\tproperty元素上的属性value:" + value); // 10.使用Element中的方法getText,获取property元素上文本内容 String text = propertyElement.getText(); System.out.println("\t\t\t\tproperty元素上的文本:" + text); } } } }