XML&反射
Posted 暴走小骚年
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了XML&反射相关的知识,希望对你有一定的参考价值。
本节内容:
- XML
- DTD约束
- Schema约束
- dom4j解析
- 反射
为了实现访问不同路径(/hello)执行不同的资源(HelloMyServlet),我们需要使用XML进行配置;为了限定XML内容,我们需要使用xml约束(DTD或schema);为了获得xml的内容,我们需要使用dom4j进行解析。更多XML的介绍参见w3cschool。
一、XML
1. 什么是XML
XML全称是Extensible Markup Language,意思是可扩展的标记语言。XML语法上和html比较相似,但HTML中的元素是固定的,而XML标签是可以由用户自定义的。
W3C在1998年2月发布了1.0版本,2004年2月发布了1.1版本,但因为1.1版本不能向下兼容1.0版本,所以1.1没有人用。同时在2004年2月W3C又发布了1.0版本的第三版。我们现如今用的仍然是1.0版本。
2. XML常见的用法
(1)配置文件
<?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5"> <servlet> <servlet-name>HelloMyServlet</servlet-name> <servlet-class>com.itheima.HelloMyServlet</servlet-class> </servlet> <servlet-mapping> <servlet-name>HelloMyServlet</servlet-name> <url-pattern>/hello</url-pattern> </servlet-mapping> </web-app>
(2)存放数据
【注意】:现在用于传输的一般是JSON,而不使用XML。
<?xml version="1.0" encoding="UTF-8"?> <persons> <person id="p001"> <name>张三</name> </person> <person id="p002"> <name>王五</name> </person> </persons>
3. XML语法
(1)XML文档声明
<?xml version="1.0" encoding="UTF-8"?>
- 文档声明必须为 <?xml 开头,以 ?> 结束;
- 文档声明必须从文档的0行0列位置开始;
- 文档声明只有两个属性:
- version:指定XML文档版本。必须属性,因为我们不会选择1.1,只会选择1.0
- encoding:指定当前文档的编码。可选属性,默认是utf-8
(2)元素 element
<servlet>
- 元素是XML文档中最重要的组成部门
- 普通元素的结构由开始标签、元素体、结束标签组成。例如:<hello>大家好</hello>
- 元素体:元素体可以是元素,也可以是文本。例如:<b><a>大家好</a></b>
- 空元素:空元素只有开始标签,没有结束标签,但元素必须自己闭合。例如:<c/>
- 元素命名:
- 区分大小写
- 不能使用空格
- 不建议以XML、xml、Xml开头
- 格式化良好的文档,必须只有一个根元素
(3)属性
<web-app version="2.5">
- 属性是元素的一部分,它必须出现在元素的开始标签中
- 属性的定义格式:属性名=属性值,其中属性值必须使用单引号或双引号
- 一个元素可以有0~N个属性,但一个元素中不能出现同名属性
- 属性名不能使用空格、冒号等特殊字符,且必须以字母开头
(4)注释
XML的注释和HTML相同,即以“<!--”开始,以“-->”结束。注释内容会被XML解析器忽略!
(5)转义字符
XML中的转义字符与HTML一样。
因为很多符号已经被XML文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符,例如:“<”、“>”、“\'”、“"”、“&”。
字符 | 字符引用(十进制代码) | 字符引用(十六进制代码) | 预定义实体引用 |
< | < | < | < |
> | > | > | > |
" | " | " | " |
\' | ' | ' | ' |
& | & | & | & |
(6)CDATA区
<![CDATA[ 任意内容 ]]>
当大量的转义字符出现在xml文档中时,会使xml文档的可读性大幅度降低。这时如果使用CDATA段就会好一些。
在CDATA段中出现的“<”、“>”、“\'”、“"”、“&”,都无需使用转义字符。这可以提高xml文档的可读性。
在CDATA段中不能包含“]]>”,即CDATA段的结束定界符。
<?xml version="1.0" ?> <hello version="1" id="1" > <a11111> </a11111> <!-- 大家好! --> <a/> <c><AAAA</c> <b> <![CDATA[ if(a>b&&b<c){ if…… } ]]> </b> </hello>
二、DTD约束
常见的xml约束:DTD、Schema。
<?xml version="1.0" ?> <!-- 约束 --> <hello version="1" id="1" > <a11111> </a11111> <!-- 大家好! --> <a/> <c><AAAA</c> <b> <![CDATA[ if(a>b&&b<c){ if…… } ]]> </b> </hello>
1. 什么是DTD
DTD(Document Type Definition),文档类型定义,用来约束XML文档。规定XML文档中元素的名称,子元素的名称及顺序,元素的属性等。
2. DTD重点要求
开发中,我们很少自己编写DTD约束文档,通常情况我们都是通过框架提供的DTD约束文档,编写对应的XML文档。常见框架使用的约束有:struts2、hibernate等。
比如通过提供的DTD“web-app_2_3.dtd”编写XML,该文件内容如下(.dtd文档可以用nodepad++等软件打开):
<?xml version="1.0" encoding="UTF-8"?> <!-- 模拟servlet2.3规范,如果开发人员需要在xml使用当前DTD约束,必须包括DOCTYPE。 格式如下: <!DOCTYPE web-app SYSTEM "web-app_2_3.dtd"> --> <!ELEMENT web-app (servlet*,servlet-mapping* , welcome-file-list?) > <!ELEMENT servlet (servlet-name,description?,(servlet-class|jsp-file))> <!ELEMENT servlet-mapping (servlet-name,url-pattern+) > <!ELEMENT servlet-name (#PCDATA)> <!ELEMENT servlet-class (#PCDATA)> <!ELEMENT url-pattern (#PCDATA)> <!ELEMENT description (#PCDATA)> <!ELEMENT jsp-file (#PCDATA)> <!ELEMENT welcome-file-list (welcome-file+)> <!ELEMENT welcome-file (#PCDATA)> <!ATTLIST web-app version CDATA #IMPLIED>
3. 案例实现
步骤1:创建web.xml文档,并将“web-app_2_3.dtd”拷贝到相同目录下。
步骤2:从DTD文档开始处,拷贝需要的“文档说明”
步骤3:完成xml文档编写
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE web-app SYSTEM "web-app_2_3.dtd"> <web-app version="1.0"> <servlet> <servlet-name></servlet-name> <servlet-class></servlet-class> </servlet> <servlet-mapping> <servlet-name></servlet-name> <url-pattern></url-pattern> </servlet-mapping> <welcome-file-list> <welcome-file></welcome-file> </welcome-file-list> </web-app>
4. DTD语法
(1)文档声明
a.内部DTD,在XML文档内部嵌入DTD,只对当前XML有效。
<?xml version="1.0" encoding="UTF-8" standalone="yes" ?> <!DOCTYPE web-app [ ... //具体的语法 ]> <web-app> </web-app>
b.外部DTD——本地DTD,DTD文档在本地系统上,公司内部自己项目使用
<?xml version="1.0" encoding="UTF-8" standalone="yes" ?> <!DOCTYPE web-app SYSTEM "web-app_2_3.dtd"> <web-app> </web-app>
c.外部DTD——公共DTD,DTD文档在网络上,一般都有框架提供
<?xml version="1.0" encoding="UTF-8" standalone="yes" ?> <!DOCTYPE web-app PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN" "http://java.sun.com/dtd/web-app_2_3.dtd"> <web-app> </web-app>
(2)元素声明
定义元素语法:<!ELEMENT 元素名 元素描述>
元素名:自定义
元素描述包含:符号和数据类型
常见符号:? * + () | ,
常见类型:#PCDATA 表示内容是文本,不能是子标签
符号 | 符号类型 | 描述 | 示例 |
? | 问号 | 表示该对象可以出现,但只能出现一次 | (菜鸟?) |
* | 星号 | 表示该对象允许出现任意多次,也可以是零次 | (爱好*) |
+ | 加号 | 表示该对象最少出现一次,可以出现多次 | (成员+) |
() | 括号 | 用来给元素分组 | (古龙|金庸|梁羽生),(张三|李四),王五 |
| | 竖条 | 表明在列出的对象中选择一个 | (男人|女人) |
, | 逗号 | 表明对象必须按指定的顺序出现 | (西瓜,苹果,香蕉) |
【示例】:
<!ELEMENT web-app (servlet*, servlet-mapping*, welcome-file-list?) > web-app 包含3个标签,且必须按顺序出现 servlet 子标签个数任意 servlet-mapping 子标签个数任意 welcome-file-list 子标签最多只能出现一次 <!ELEMENT servlet (servlet-name*, description?, (servlet-class|jsp-file)) > servlet 有3个子标签,且必须按顺序出现 servlet-name,必须有,且只能出现一次 description,可选一次 servlet-class 和 jsp-file 二选一,且只能出现一次 <!ELEMENT servlet-name (#PCDATA) > servlet-name 的标签体必须是文本 <!ELEMENT welcome-file-list (welcome-file+) > welcome-file-list 至少有一个子标签 welcome-file
(3)属性声明
<!ATTLIST 元素名 属性名 属性类型 约束 属性名 属性类型 约束 ... > 元素名:属性必须是给元素添加,所有必须先确定元素名 属性名:自定义 属性类型:ID、CDATA、枚举 ... ID:ID类型的属性用来标识元素的唯一性 CDATA:文本类型 枚举:(e1 | e2 | ...)多选一 约束: #REQUIRED:说明属性是必须的;required #IMPLIED:说明属性是可选的;implied
<!ATTLIST web-app version CDATA #IMPLIED> 给 web-app 元素添加version属性,属性值必须是文本,且可选。 <web-app version="2.3"> 和 <web-app> 都符合结束。
对于DTD文档,我们要能够根据别人给的DTD文档写出XML文件。
三、Schema约束
1. 什么是Schema
- Schema是新的XML文档约束
- Schema要比DTD强大很多,是DTD替代者
- Schema本身也是XML文档,但Schema文档的扩展名为xsd,而不是xml
- Schema功能更强大,数据类型更完善
- Schema支持名称空间:为了区分同样的属性
2. Schema重点要求
与DTD一样,要求可以通过schema约束文档编写xml文档。常见框架使用schema的有:Spring等。
比如通过“web-app_2_5.xsd”编写xml文档,该文档内容如下:
<?xml version="1.0" encoding="UTF-8"?> <!-- 模拟servlet2.5规范,如果开发人员需要在xml使用当前Schema约束,必须包括指定命名空间。 格式如下: <web-app xmlns="http://www.example.org/web-app_2_5" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd" version="2.5"> --> <xsd:schema xmlns="http://www.w3.org/2001/XMLSchema" targetNamespace="http://www.example.org/web-app_2_5" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:tns="http://www.example.org/web-app_2_5" elementFormDefault="qualified"> <xsd:element name="web-app"> <xsd:complexType> <xsd:choice minOccurs="0" maxOccurs="unbounded"> <xsd:element name="servlet"> <xsd:complexType> <xsd:sequence> <xsd:element name="servlet-name"></xsd:element> <xsd:element name="servlet-class"></xsd:element> </xsd:sequence> </xsd:complexType> </xsd:element> <xsd:element name="servlet-mapping"> <xsd:complexType> <xsd:sequence> <xsd:element name="servlet-name"></xsd:element> <xsd:element name="url-pattern" maxOccurs="unbounded"></xsd:element> </xsd:sequence> </xsd:complexType> </xsd:element> <xsd:element name="welcome-file-list"> <xsd:complexType> <xsd:sequence> <xsd:element name="welcome-file" maxOccurs="unbounded"></xsd:element> </xsd:sequence> </xsd:complexType> </xsd:element> </xsd:choice> <xsd:attribute name="version" type="double" use="optional"></xsd:attribute> </xsd:complexType> </xsd:element> </xsd:schema>
该文档中同一个“命名空间”分别使用“默认命名空间”和“显式命名空间”进行引入,所以文档中<schema>和<xsd:schema>作用一样。
3. 案例实现
步骤1:创建web.xml,并将“web-app_2_5.xsd”拷贝到同级目录
步骤2:从xsd文档中拷贝需要的“命名空间”
步骤3:完成xml内容编写
<?xml version="1.0" encoding="UTF-8"?> <web-app xmlns="http://www.example.org/web-app_2_5" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd" version="2.5"> <servlet> <servlet-name>helloServlet</servlet-name> <servlet-class>xxxxxxxxxx</servlet-class> </servlet> <servlet-mapping> <servlet-name>helloServlet</servlet-name> <url-pattern>/hello</url-pattern> </servlet-mapping> </web-app>
4. 命名空间(语法)
(1)什么是命名空间
如果一个XML文档中使用多个Schema文件,而这些Schema文件中定义了相同名称的元素时就出现名字冲突。这就像一个java文件中使用了import java.util.*和import java.sql.*时,在使用Date类时,那么就不明确Date是哪个包下的Date了。
名称空间就是用来处理元素和属性的名称冲突问题,与java中的包是同一用途。如果每个元素和属性都有自己的名称空间,那么就不会出现名字冲突问题,就像是每个类都有自己所在的包一样,那么类名就不会出现冲突。
(2)约束文档和XML关系
当w3c提出Schema约束规范时,就提供“官方约束文档”。我们通过官方文档,必须“自定义schema约束文档”,开发中“自定义文档”由框架编写者提供。我们提供“自定义文档”限定,编写出自己的xml文档。
(3)声明命名空间
默认命名空间:<xxx xmlns="">,使用<标签> 显式命名空间:<xxx xmlns:别名="">,使用<别名:标签>
示例:web-app_2_5.xsd
<xsd:schema xmlns="http://www.w3.org/2001/XMLSchema" ...> 表示自定义schema约束文档引用官方文档作为显示命名空间。如果要使用官方提供的元素或属性,必须使用xsd前缀(自定义,此处表示官方文档,所以使用xsd) <xsd:schema>标签就有官方文档提供,默认命名空间直接使用
示例:web.xml
<web-app xmlns="http://www.example.org/web-app_2_5" ...> 表示xml文档引用“自定义约束文档”作为默认命名空间 因为使用默认命名空间,<web-app>直接使用
(4)其他介绍
自定义约束:web-app_2_5.xsd
<xsd:schema targetNamespace=http://www.example.org/web-app_2_5 表示当前自定义约束文档进行起名,提供给xml文档使用。
xml文档:web.xml
<web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd" xmlns:xsi="" 固定写法 表示是一个schema实例文档,就是被schemaw文档约束的xml文档。 xsi:schemaLocation="名称 路径 名称 路径 名称 路径 ..." 表示用于确定当前xml文档使用到的schema文档的位置。“名称 路径”是成对出现,与xmlns引用命名空间对应。
一般schema约束都是别人提供好了,我们拿过来按照要求写出XML文档即可。
四、dom4j解析
(1)XML解析概述
当将数据存储在XML后,我们就希望通过程序获得XML的内容。如果我们使用Java基础所学习的IO知识是可以完成的,不过你需要非常繁琐的操作才可以完成,且开发中会遇到不同问题(只读、读写)。人们为不同问题提供不同的解析方式,并提交对应的解析器,方便开发人员操作XML。
(2)解析方式和解析器
开发中比较常见的解析方式有三种,如下:
- DOM:要求解析器把整个XML文档载入内存,并解析成一个Document对象。
- 优点:元素和元素之间保留结构关系,故可以进行增删改查操作。
- 缺点:如果XML文档过大,可能出现内存溢出
- SAX:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件驱动的方式进行具体解析,每执行一行,都将触发对应的事件
- 优点:处理速度快,可以处理大文件
- 缺点:只能读,逐行后将释放资源。而且不能往回读。
- PULL:android内置的XML解析方式,类似SAX
解析器:就是根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。
常见的解析开发包:
- JAXP:sun公司提供支持DOM和SAX开发包
- JDom:dom4j兄弟
- jsoup:一种处理HTML特定解析开发包
- dom4j:比较常用的解析开发包,hibernate底层采用
(3)DOM解析原理及结构模型
XML DOM和HTML DOM类似,XML DOM将整个XML文档加载到内存,生成一个DOM树,并获得一个Document对象,通过Document对象就可以对DOM进行操作。
<?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5"> <servlet> <servlet-name>helloServlet</servlet-name> <servlet-class>cn.itcast.HelloServlet</servlet-class> </servlet> <servlet-mapping> <servlet-name>helloServlet</servlet-name> <url-pattern>/hello</url-pattern> </servlet-mapping> </web-app>
DOM的核心概念是节点,在XML文档中的元素、属性、文本等,在DOM中都是节点。
(4)API使用
如果需要使用dom4j,必须导入jar包。
dom4j必须使用核心类SaxReader加载xml文档获得Document,通过Document对象获得文档的根元素,然后就可以操作了。
常用API如下:
- SaxReader对象
- read(...) 加载执行xml文档
- Document对象
- getRootElement() 获得根元素
- Element对象
- elements(...) 获得指定名称的所有子元素。可以不指定名称
- element(...) 获得指定名称第一个元素。可以不指定名称
- getName() 获得当前元素的元素名
- attributeValue(...) 获得指定属性名的属性值
- elementText(...) 获得指定名称子元素的文本值
- getText() 获得当前元素的文本内容
【示例】:
<?xml version="1.0" encoding="UTF-8"?> <web-app xmlns="http://www.example.org/web-app_2_5" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd" version="2.5"> <servlet> <servlet-name>helloServlet</servlet-name> <servlet-class>xxxxxxxxxx</servlet-class> </servlet> <servlet-mapping> <servlet-name>helloServlet</servlet-name> <url-pattern>/hello</url-pattern> </servlet-mapping> </web-app>
public class TestDom4j { @Test public void testReadWebXML() { try为 Blogger 上的博客格式化代码片段 [关闭]从 XML 声明片段获取 XML 编码:部分内容解析不支持 XmlDeclaration