XMLDTDSchemadom4j解析
Posted boss-h
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了XMLDTDSchemadom4j解析相关的知识,希望对你有一定的参考价值。
XML:可扩展的标记语言
XML语法上和html比较相似,但HTML中的元素是固定的,而XML的标签是可以由用户自定义的。
XML语法:
XML文档声明
1.文档声明必须为<?xml开头,以?>结束;
2.文档声明必须从文档的0行0列位置开始:
3.文档声明只有属性:
a) versioin:指定XML文档版本。
b) encoding:指定当前文档的编码。可选属性,默认值是。utf-8:
元素element
1.元素是XML文档中最重要的组成部分,
2.普通元素的结构开始标签、元素体、结束标签组成。
3.元素体:元素体可以是元素,也可以是文本。
4.空元素:空元素只有开始标签,而没有结束标签,但元素必须自己闭介。
5.元素命名:
a) 区分大小写
b) 不能使用空格,不能使用冒号:
c) 不建议以XML, xml, Xml开头
6.格式化良好的XML文档,必须只有一个根元素。
属性
1.属性是元素的一部分,它必须出现在元素的开始标签中
2.属性的定义格式:属性名=属性值,其中属性值必须使用单引或双引
3.一个元素可以有O ~ N个属性,但一个元素中不能出现同名属性
4.属性名不能使用空格、冒号等特殊字符,且必须以字母开头
注释
XML的注释与HTML相同,即以“<!--”开始,以“-->”结束。注释内容会被XML解析器忽略!
转义字符
XML中的转义字符与HTML一样。
因为很多符号己经被XML文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符。
CDATA区
当大量的转义字符出现在xml文档中时,会使xml文档的可读性大幅度降低。这时如果使用CDATA段就会好一些。
在CDATA段中出现的“<”、“>’,、“””、“‘”、“&”,都无需使用转义字符。这可以提高xml文档的可读性。
在CDATA段中不能包含“]]>”,即CDATA段的结束定界符。
DTD:文档类型定义,用来约束XML文档。规定XML文档中元素的名称,子元素的名称及顺序,元素的属性等。
DTD语法:
1.内部DTD,在XML文档内部嵌入DTD,只对当前XML有效。
2.外部DTD——本地DTD,DTD文档在本地系统上,公司内部自己项目使用。
3.外部DTD——公共DTD,DTD文档在网络上,一般都有框架提供。
Schema约束:
Schema是新的XML文档约束。
Schema要比DTD强大很多,是DTD替代者。
Schema本身也是XML文档,但Schema文档的扩展名为xsd,而不是xml。
Schema功能更强大,数据类型更完善。
Schema支持名称空间。
dom4j解析:
解析方式和解析器:
开发中比较常见的解析方式有三种,如下:
1.DOM:要求解析器把整个XML文档装载到内存,并解析成一个Document对象。
a) 优点:元素与元素之间保留结构关系,故可以进行增删改查操作。
b) 缺点:XML文档过大,可能出现内存溢出显现。
SAX:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件 驱动的方式进行具体解析,每执行一行,都将触发对应的事件。
a) 优点:处理速度快,可以处理大文件
b) 缺点:只能读,逐行后将释放资源。
3. PULL: android内置的XML解析方式,类似SAX。
解析器:就是根据不同的解析方式提供的具体实现。
以上是关于XMLDTDSchemadom4j解析的主要内容,如果未能解决你的问题,请参考以下文章