XML&反射

Posted 2020-10-18 暴走小骚年

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了XML&反射相关的知识，希望对你有一定的参考价值。

本节内容：

XML
DTD约束
Schema约束
dom4j解析
反射

为了实现访问不同路径（/hello）执行不同的资源（HelloMyServlet），我们需要使用XML进行配置；为了限定XML内容，我们需要使用xml约束（DTD或schema）；为了获得xml的内容，我们需要使用dom4j进行解析。更多XML的介绍参见w3cschool。

一、XML

1. 什么是XML

XML全称是Extensible Markup Language，意思是可扩展的标记语言。XML语法上和html比较相似，但HTML中的元素是固定的，而XML标签是可以由用户自定义的。

W3C在1998年2月发布了1.0版本，2004年2月发布了1.1版本，但因为1.1版本不能向下兼容1.0版本，所以1.1没有人用。同时在2004年2月W3C又发布了1.0版本的第三版。我们现如今用的仍然是1.0版本。

2. XML常见的用法

（1）配置文件

<?xml version="1.0" encoding="UTF-8"?>
<web-app version="2.5">
  <servlet>
    <servlet-name>HelloMyServlet</servlet-name>
    <servlet-class>com.itheima.HelloMyServlet</servlet-class>
  </servlet>
  <servlet-mapping>
    <servlet-name>HelloMyServlet</servlet-name>
    <url-pattern>/hello</url-pattern>
  </servlet-mapping>
</web-app>

（2）存放数据

【注意】：现在用于传输的一般是JSON，而不使用XML。

<?xml version="1.0" encoding="UTF-8"?>
<persons>
  <person id="p001">
    <name>张三</name>
  </person>
  <person id="p002">
    <name>王五</name>
  </person>
</persons>

3. XML语法

（1）XML文档声明

<?xml version="1.0" encoding="UTF-8"?>

文档声明必须为 <?xml 开头，以 ?> 结束；
文档声明必须从文档的0行0列位置开始；
文档声明只有两个属性：
- version：指定XML文档版本。必须属性，因为我们不会选择1.1，只会选择1.0
- encoding：指定当前文档的编码。可选属性，默认是utf-8

（2）元素 element

<servlet>

元素是XML文档中最重要的组成部门
普通元素的结构由开始标签、元素体、结束标签组成。例如：<hello>大家好</hello>
元素体：元素体可以是元素，也可以是文本。例如：<b><a>大家好</a></b>
空元素：空元素只有开始标签，没有结束标签，但元素必须自己闭合。例如：<c/>
元素命名：
- 区分大小写
- 不能使用空格
- 不建议以XML、xml、Xml开头
格式化良好的文档，必须只有一个根元素

（3）属性

<web-app version="2.5">

属性是元素的一部分，它必须出现在元素的开始标签中
属性的定义格式：属性名=属性值，其中属性值必须使用单引号或双引号
一个元素可以有0~N个属性，但一个元素中不能出现同名属性
属性名不能使用空格、冒号等特殊字符，且必须以字母开头

（4）注释

XML的注释和HTML相同，即以“”结束。注释内容会被XML解析器忽略！

（5）转义字符

XML中的转义字符与HTML一样。

因为很多符号已经被XML文档结构所使用，所以在元素体或属性值中想使用这些符号就必须使用转义字符，例如：“<”、“>”、“\'”、“"”、“&”。

字符	字符引用（十进制代码）	字符引用（十六进制代码）	预定义实体引用
<	<	<	<
>	>	>	>
"	"	"	"
\'	'	'	'
&	&	&	&

（6）CDATA区

<![CDATA[
    任意内容
]]>

当大量的转义字符出现在xml文档中时，会使xml文档的可读性大幅度降低。这时如果使用CDATA段就会好一些。

在CDATA段中出现的“<”、“>”、“\'”、“"”、“&”，都无需使用转义字符。这可以提高xml文档的可读性。

在CDATA段中不能包含“]]>”，即CDATA段的结束定界符。

<?xml version="1.0" ?>
<hello version="1" id="1" >
    <a11111>
        
    </a11111>
    <!-- 大家好！ -->
    <a/>
    <c>&lt;AAAA</c>
    <b>
        <![CDATA[
            if(a>b&&b<c){
            if……
            }
        ]]>
    </b>
    
</hello>

示例

二、DTD约束

常见的xml约束：DTD、Schema。

<?xml version="1.0" ?>
<!-- 约束 -->
<hello version="1" id="1" >
    <a11111>
        
    </a11111>
    <!-- 大家好！ -->
    <a/>
    <c>&lt;AAAA</c>
    <b>
        <![CDATA[
            if(a>b&&b<c){
            if……
            }
        ]]>
    </b>
</hello>

约束在XML文章中的位置

1. 什么是DTD

DTD（Document Type Definition），文档类型定义，用来约束XML文档。规定XML文档中元素的名称，子元素的名称及顺序，元素的属性等。

2. DTD重点要求

开发中，我们很少自己编写DTD约束文档，通常情况我们都是通过框架提供的DTD约束文档，编写对应的XML文档。常见框架使用的约束有：struts2、hibernate等。

比如通过提供的DTD“web-app_2_3.dtd”编写XML，该文件内容如下(.dtd文档可以用nodepad++等软件打开)：

<?xml version="1.0" encoding="UTF-8"?>
<!--
    模拟servlet2.3规范，如果开发人员需要在xml使用当前DTD约束，必须包括DOCTYPE。
    格式如下：
    <!DOCTYPE web-app SYSTEM "web-app_2_3.dtd">
-->
<!ELEMENT web-app (servlet*,servlet-mapping* , welcome-file-list?) >
<!ELEMENT servlet (servlet-name,description?,(servlet-class|jsp-file))>
<!ELEMENT servlet-mapping (servlet-name,url-pattern+) >
<!ELEMENT servlet-name (#PCDATA)>
<!ELEMENT servlet-class (#PCDATA)>
<!ELEMENT url-pattern (#PCDATA)>
<!ELEMENT description (#PCDATA)>
<!ELEMENT jsp-file (#PCDATA)>

<!ELEMENT welcome-file-list (welcome-file+)>
<!ELEMENT welcome-file (#PCDATA)>

<!ATTLIST web-app version CDATA #IMPLIED>

web-app_2_3.dtd

3. 案例实现

步骤1：创建web.xml文档，并将“web-app_2_3.dtd”拷贝到相同目录下。

步骤2：从DTD文档开始处，拷贝需要的“文档说明”

步骤3：完成xml文档编写

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE web-app SYSTEM "web-app_2_3.dtd">
<web-app version="1.0">
    <servlet>
        <servlet-name></servlet-name>
        <servlet-class></servlet-class>
    </servlet>
    <servlet-mapping>
        <servlet-name></servlet-name>
        <url-pattern></url-pattern>
    </servlet-mapping>
    <welcome-file-list>
        <welcome-file></welcome-file>
    </welcome-file-list>
</web-app>

XML文档示例

4. DTD语法

（1）文档声明

a.内部DTD，在XML文档内部嵌入DTD，只对当前XML有效。

<?xml version="1.0" encoding="UTF-8" standalone="yes" ?>
<!DOCTYPE web-app [
    ... //具体的语法
]>
<web-app>
</web-app>

b.外部DTD——本地DTD，DTD文档在本地系统上，公司内部自己项目使用

<?xml version="1.0" encoding="UTF-8" standalone="yes" ?>
<!DOCTYPE web-app SYSTEM "web-app_2_3.dtd">
<web-app>
</web-app>

c.外部DTD——公共DTD，DTD文档在网络上，一般都有框架提供

<?xml version="1.0" encoding="UTF-8" standalone="yes" ?>
<!DOCTYPE web-app  PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN" "http://java.sun.com/dtd/web-app_2_3.dtd">
<web-app>
</web-app>

（2）元素声明

定义元素语法：<!ELEMENT 元素名元素描述>

　　元素名：自定义

　　元素描述包含：符号和数据类型

　　　　常见符号：? * + () | ,

　　　　常见类型：#PCDATA 表示内容是文本，不能是子标签

符号	符号类型	描述	示例
?	问号	表示该对象可以出现，但只能出现一次	(菜鸟?)
*	星号	表示该对象允许出现任意多次，也可以是零次	(爱好*)
+	加号	表示该对象最少出现一次，可以出现多次	(成员+)
()	括号	用来给元素分组	(古龙\|金庸\|梁羽生),(张三\|李四),王五
\|	竖条	表明在列出的对象中选择一个	(男人\|女人)
,	逗号	表明对象必须按指定的顺序出现	(西瓜,苹果,香蕉)

【示例】：

<!ELEMENT web-app (servlet*, servlet-mapping*, welcome-file-list?) >
    web-app 包含3个标签，且必须按顺序出现
        servlet 子标签个数任意
        servlet-mapping 子标签个数任意
        welcome-file-list 子标签最多只能出现一次

<!ELEMENT servlet (servlet-name*, description?, (servlet-class|jsp-file)) >
    servlet 有3个子标签，且必须按顺序出现
    servlet-name，必须有，且只能出现一次
    description，可选一次
    servlet-class 和 jsp-file 二选一，且只能出现一次

<!ELEMENT servlet-name (#PCDATA) >
    servlet-name 的标签体必须是文本

<!ELEMENT welcome-file-list (welcome-file+) >
    welcome-file-list 至少有一个子标签 welcome-file

（3）属性声明

<!ATTLIST 元素名

　　属性名 属性类型 约束
　　属性名 属性类型 约束
　　...
>
元素名：属性必须是给元素添加，所有必须先确定元素名
属性名：自定义
属性类型：ID、CDATA、枚举 ...
    ID：ID类型的属性用来标识元素的唯一性
    CDATA：文本类型
    枚举：(e1 | e2 | ...)多选一
约束：
    #REQUIRED：说明属性是必须的；required
    #IMPLIED：说明属性是可选的；implied

属性的语法(attribute)

<!ATTLIST web-app version CDATA #IMPLIED>
    给 web-app 元素添加version属性，属性值必须是文本，且可选。
    <web-app version="2.3"> 和 <web-app> 都符合结束。

示例

对于DTD文档，我们要能够根据别人给的DTD文档写出XML文件。

三、Schema约束

1. 什么是Schema

Schema是新的XML文档约束
Schema要比DTD强大很多，是DTD替代者
Schema本身也是XML文档，但Schema文档的扩展名为xsd，而不是xml
Schema功能更强大，数据类型更完善
Schema支持名称空间：为了区分同样的属性

2. Schema重点要求

与DTD一样，要求可以通过schema约束文档编写xml文档。常见框架使用schema的有：Spring等。

比如通过“web-app_2_5.xsd”编写xml文档，该文档内容如下：

<?xml version="1.0" encoding="UTF-8"?>
<!-- 
    模拟servlet2.5规范，如果开发人员需要在xml使用当前Schema约束，必须包括指定命名空间。
    格式如下：
    <web-app xmlns="http://www.example.org/web-app_2_5" 
            xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
            xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd"
            version="2.5">
-->
<xsd:schema xmlns="http://www.w3.org/2001/XMLSchema" 
    targetNamespace="http://www.example.org/web-app_2_5"
    xmlns:xsd="http://www.w3.org/2001/XMLSchema"
    xmlns:tns="http://www.example.org/web-app_2_5" 
    elementFormDefault="qualified">
    
    <xsd:element name="web-app">
        <xsd:complexType>
            <xsd:choice minOccurs="0" maxOccurs="unbounded">
                <xsd:element name="servlet">
                    <xsd:complexType>
                        <xsd:sequence>
                            <xsd:element name="servlet-name"></xsd:element>
                            <xsd:element name="servlet-class"></xsd:element>
                        </xsd:sequence>
                    </xsd:complexType>
                </xsd:element>
                <xsd:element name="servlet-mapping">
                    <xsd:complexType>
                        <xsd:sequence>
                            <xsd:element name="servlet-name"></xsd:element>
                            <xsd:element name="url-pattern" maxOccurs="unbounded"></xsd:element>
                        </xsd:sequence>
                    </xsd:complexType>
                </xsd:element>
                <xsd:element name="welcome-file-list">
                    <xsd:complexType>
                        <xsd:sequence>
                            <xsd:element name="welcome-file" maxOccurs="unbounded"></xsd:element>
                        </xsd:sequence>
                    </xsd:complexType>
                </xsd:element>
            </xsd:choice>
            <xsd:attribute name="version" type="double" use="optional"></xsd:attribute>
        </xsd:complexType>
    </xsd:element>
</xsd:schema>

web-app_2_5.xsd

该文档中同一个“命名空间”分别使用“默认命名空间”和“显式命名空间”进行引入，所以文档中<schema>和<xsd:schema>作用一样。

3. 案例实现

步骤1：创建web.xml，并将“web-app_2_5.xsd”拷贝到同级目录

步骤2：从xsd文档中拷贝需要的“命名空间”

步骤3：完成xml内容编写

<?xml version="1.0" encoding="UTF-8"?>
<web-app xmlns="http://www.example.org/web-app_2_5" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd"
    version="2.5">

    <servlet>
        <servlet-name>helloServlet</servlet-name>
        <servlet-class>xxxxxxxxxx</servlet-class>
    </servlet>
    <servlet-mapping>
        <servlet-name>helloServlet</servlet-name>
        <url-pattern>/hello</url-pattern>
    </servlet-mapping>
</web-app>

web.xml

4. 命名空间（语法）

（1）什么是命名空间

如果一个XML文档中使用多个Schema文件，而这些Schema文件中定义了相同名称的元素时就出现名字冲突。这就像一个java文件中使用了import java.util.*和import java.sql.*时，在使用Date类时，那么就不明确Date是哪个包下的Date了。

名称空间就是用来处理元素和属性的名称冲突问题，与java中的包是同一用途。如果每个元素和属性都有自己的名称空间，那么就不会出现名字冲突问题，就像是每个类都有自己所在的包一样，那么类名就不会出现冲突。

（2）约束文档和XML关系

当w3c提出Schema约束规范时，就提供“官方约束文档”。我们通过官方文档，必须“自定义schema约束文档”，开发中“自定义文档”由框架编写者提供。我们提供“自定义文档”限定，编写出自己的xml文档。

（3）声明命名空间

默认命名空间：<xxx xmlns="">，使用<标签>
显式命名空间：<xxx xmlns:别名="">，使用<别名:标签>

示例：web-app_2_5.xsd

<xsd:schema xmlns="http://www.w3.org/2001/XMLSchema" ...>
    表示自定义schema约束文档引用官方文档作为显示命名空间。如果要使用官方提供的元素或属性，必须使用xsd前缀（自定义，此处表示官方文档，所以使用xsd）
    <xsd:schema>标签就有官方文档提供，默认命名空间直接使用

示例：web.xml

<web-app xmlns="http://www.example.org/web-app_2_5" ...>
    表示xml文档引用“自定义约束文档”作为默认命名空间
    因为使用默认命名空间，<web-app>直接使用

（4）其他介绍

自定义约束：web-app_2_5.xsd

<xsd:schema targetNamespace=http://www.example.org/web-app_2_5
    表示当前自定义约束文档进行起名，提供给xml文档使用。

xml文档：web.xml

<web-app 
        xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd"
    
    xmlns:xsi=""  固定写法
        表示是一个schema实例文档，就是被schemaw文档约束的xml文档。
    xsi:schemaLocation="名称 路径  名称 路径  名称 路径  ..."
        表示用于确定当前xml文档使用到的schema文档的位置。“名称 路径”是成对出现，与xmlns引用命名空间对应。

一般schema约束都是别人提供好了，我们拿过来按照要求写出XML文档即可。

四、dom4j解析

（1）XML解析概述

当将数据存储在XML后，我们就希望通过程序获得XML的内容。如果我们使用Java基础所学习的IO知识是可以完成的，不过你需要非常繁琐的操作才可以完成，且开发中会遇到不同问题（只读、读写）。人们为不同问题提供不同的解析方式，并提交对应的解析器，方便开发人员操作XML。

（2）解析方式和解析器

开发中比较常见的解析方式有三种，如下：

DOM：要求解析器把整个XML文档载入内存，并解析成一个Document对象。
- 优点：元素和元素之间保留结构关系，故可以进行增删改查操作。
- 缺点：如果XML文档过大，可能出现内存溢出

SAX：是一种速度更快，更有效的方法。它逐行扫描文档，一边扫描一边解析。并以事件驱动的方式进行具体解析，每执行一行，都将触发对应的事件
- 优点：处理速度快，可以处理大文件
- 缺点：只能读，逐行后将释放资源。而且不能往回读。
PULL：android内置的XML解析方式，类似SAX

解析器：就是根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐，为了方便开发人员，有提供易于操作的解析开发包。

常见的解析开发包：

JAXP：sun公司提供支持DOM和SAX开发包
JDom：dom4j兄弟
jsoup：一种处理HTML特定解析开发包
dom4j：比较常用的解析开发包，hibernate底层采用

（3）DOM解析原理及结构模型

XML DOM和HTML DOM类似，XML DOM将整个XML文档加载到内存，生成一个DOM树，并获得一个Document对象，通过Document对象就可以对DOM进行操作。

<?xml version="1.0" encoding="UTF-8"?>
<web-app version="2.5">
    <servlet>
        <servlet-name>helloServlet</servlet-name>
        <servlet-class>cn.itcast.HelloServlet</servlet-class>
    </servlet>
    <servlet-mapping>
        <servlet-name>helloServlet</servlet-name>
        <url-pattern>/hello</url-pattern>
    </servlet-mapping>
</web-app>

DOM的核心概念是节点，在XML文档中的元素、属性、文本等，在DOM中都是节点。

（4）API使用

如果需要使用dom4j，必须导入jar包。

dom4j必须使用核心类SaxReader加载xml文档获得Document，通过Document对象获得文档的根元素，然后就可以操作了。

常用API如下：

SaxReader对象
- read(...) 加载执行xml文档

Document对象
- getRootElement() 获得根元素
Element对象
- elements(...) 获得指定名称的所有子元素。可以不指定名称
- element(...) 获得指定名称第一个元素。可以不指定名称
- getName() 获得当前元素的元素名
- attributeValue(...) 获得指定属性名的属性值
- elementText(...) 获得指定名称子元素的文本值
- getText() 获得当前元素的文本内容

【示例】：

<?xml version="1.0" encoding="UTF-8"?>
<web-app xmlns="http://www.example.org/web-app_2_5" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.example.org/web-app_2_5 web-app_2_5.xsd"
    version="2.5">

    <servlet>
        <servlet-name>helloServlet</servlet-name>
        <servlet-class>xxxxxxxxxx</servlet-class>
    </servlet>
    <servlet-mapping>
        <servlet-name>helloServlet</servlet-name>
        <url-pattern>/hello</url-pattern>
    </servlet-mapping>
</web-app>

web.xml

public class TestDom4j {
    @Test
    public void testReadWebXML() {
        try

   
 (c)2006-2024 SYSTEM All Rights Reserved  IT常识