Java Web学习之XMl学习

Posted 2021-07-12 听路走歌

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Java Web学习之XMl学习相关的知识，希望对你有一定的参考价值。

概念：Extensible Markup Language 可扩展标记语言

注意：xml版本不能向下兼

1，可扩展：标签都是自定义的。符合标签命名规则即可
   2，功能：
       *存储数据
           1，配置文件
           2，在网络中传输

3，xml和html的区别：
       1，xml标签都是自定义的，html标签都是预定义的
       2，xml语法严格，html语法松散
       3，xml是存储数据的，html是展示数据的

语法：
   1，基本语法：
       1，xml文档后缀名：.xml
       2，xml第一行必须位文档声明
       3，xml文档中有且仅有一个根标签
       4，属性值必须使用引号（单双都可）引起来
       5, 标签必须正确关闭
   2，快速入门：

<?xml version='1.0' ?>
<users>
    <user id = '1'>
        <name>zhangsan</name>
        <age>18</age>
        <gender>male</gender>
    </user>
</users>

   3，组成部分：
       1，文档申明
           1，格式：<?xml 属性列表 ?>
           2，属性列表：
               *version:版本号必须的属性，不写会报错
               *encoding：编码方式。告知解析引擎当前文档使用的字符集，默认值：ISO-8859-1
               *standalone：是否独立
                   取值：（基本不设置了，仅需要了解）
                       yes：不依赖其他文件
                       no：依赖其他文件

       2，指令（了解内容忽略）

       3，标签：
           规则：
           1，名称可以包含字母、数字以及其他字符
           2，名称不能以数字后者标点符号开头
           3，名称不能以字母 xml（或者XML、Xml等等）开头
           4，名称不能包含空格

4，属性：
id属性值唯一键值对构成

       5，文本
           CDATA区：在该区域的数据会被原样展示

格式：<![CDATA[ 数据]]>

       6，约束：规定xml文档的书写规则
           *作为框架的使用者（程序员）：
           1，能够在xml中引入约束文档
           2，能够简单读懂约束文档
           *分类：
               1，DTD：一种简单的约束技术
               2，Schema：一种复杂的约束技术
           *DTD：
           *引入dtd文档到xml文档中
               *内部dtd：将约束规则定义在xml文档中
               *外部dtd：将约束规则定义在外部的dtd文件中

*本地：<!DOCTYPE 根标签名 SYSTEM "dtd文件位置">
*网络：<!DOCTYPE 根标签名 PUBLIC "dtd文件名字" "dtd文件位置URL">

           Schema：
           *引入：
               1.填写xml文档的根元素
               2.引入xsi前缀. xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
               3.引入xsd文件命名空间. xsi:schemaLocation="http://www.itcast.cn/xml student.xsd"
               4.为每一个xsd约束声明一个前缀,作为标识 xmlns="http://www.itcast.cn/xml"


3，解析：操作xml文档，将文档中的数据读取到内存中
   *操作xml文档
       1，解析（读取）：将文档的数据写入内存中
       2，写入：将内存中的数据保存到xml文档中。持久化存储

   *解析xml的方式：
       1，DOM：将标记语言文档一次性加载进内存，在内存中形成一颗dom树
           优点：操作方便，可以对文档进行CRUD的所有操作
           缺点：占内存
       2，SAX：逐行读取，基于事件驱动
           优点：不占内存
           缺点：只能读取，不能增删改
   一般服务器端会使用DOM思想，移动端使用SAX思想

   xml常见的解析器：
       1，JAXP：sun公司提供的解析器，支持dom和sax两种思想
       2，DOM4J：基于DOM思想的一款非常优秀的解析器
       3，Jsoup：jsoup是一款java的HTML解析器，可以直接解析某个URl地址、HTMl文本内容，它提供了一套非常省力的API，
       可通过DOM，CSS以及类似于JQuery的操作方法来取出和操作数据
   4，PULL：android操作系统内置的解析器，sax方式的

       Jsoup：jsoup是一款java的HTML解析器，可以直接解析某个URl地址、HTMl文本内容，它提供了一套非常省力的API，
       可通过DOM，CSS以及类似于JQuery的操作方法来取出和操作数据
       快速入门：
           步骤：
               1，导入jar包
               2，获取DOcument对象
               3，获取对应的标签Element对象
               4，获取数据

       对象的使用：
               1，Jsoup：工具类，可以解析html或者xml文档，返回Docunment
                   parse：解析html或者xml文档，返回Document
                       *parse(File in,String charetNmae):解析xml或者html文件的
                       如：常用：

parse：解析html或者xml文档，返回Document
		*parse(File in,String charetNmae):解析xml或者html文件的
		如：常用：
	 String path = 
JsoupDemo2.class.getClassLoader().getResource("student.xml").getPath();
     Document document = Jsoup.parse(new File(path),"utf-8");
						 
		*parse(String html):解析xml或者html字符串的
		*parse(URL,url,int timeoutMillis):通过网络路径获取指定的html或者xml的文档对象
		如：
		URL url = new URL("https://baike.baidu.com/item/jsoup/9012509?fr=aladdin");
		Document document = Jsoup.parse(url,10000);

               2，Document：文档对象，代表内存中的dom树
                   *获取Element对象
                       getElementById（String id):根据id属性值获取唯一的element对象
                       getElememtsByTag(String tagName):根据标签名获取元素对象集合
                       getElementsByAttribute（String key):根据属性名称获取元素对象集合
                       getElementsByAttributeValue（String key,String value):根据对应的属性名和属性值获取元素对象

               3，Elements：元素Element对象的集合。可以当做ArrayList来使用

               4，Element：元素对象
                   1，获取子元素对象
                       getElementById（String id):根据id属性值获取唯一的element对象
                       getElememtsByTag(String tagName):根据标签名获取元素对象集合
                       getElementsByAttribute（String key):根据属性名称获取元素对象集合
                       getElementsByAttributeValue（String key,String value):根据对应的属性名和属性值获取元素对象
                   2，获取属性值
                       *String attr(String key):根据属性名称获取属性值
                   3，获取文本内容
                       *String text（）：获取文本内容打印纯文本
                       *STring html（）：获取标签体的所有内容（包括标签体的字符串内容）把包括标签在内都打印
               5，Node：节点对象
                   是Document和Element的父类
       快捷查询方式：
               1，selector：选择器
                   *使用方法：Element select(STring cssQuery)
                       语法：参考selector类中定义的语法
               2，Xpath：XPath：XPath为XMl的路径语言，它是用来确定XMl文档中某部分位置的语言
                   *使用Jsoup的XPath需要额外导入jar包
                   *查询w3cschool参考手册，使用xpath的语法完成查询

以上是关于Java Web学习之XMl学习的主要内容，如果未能解决你的问题，请参考以下文章