XMLHdf5dat等后缀文件的简介

Posted 爱编程的药学生

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了XMLHdf5dat等后缀文件的简介相关的知识,希望对你有一定的参考价值。

XML文件

XML简介

     什么是XML? XML 指可扩展标记语言(EXtensible Markup Language) XML 是一种标记语言,很类似html。XML的设计宗旨是传输数据,而非显示数据,XML标签没有被预定义。您需要自行定义标签。XML 被设计为具有自我描述性。XML是 W3C的推荐标准。癌症生物信息学中,从TCGA数据库中下载的患者临床信息均为XML文件,建议使用python或perl对临床信息进行提取。
      在人脸识别中,Haar特征分类器就是一个XML文件,不同的xml文件,就是不同的分类器,描述人体不同部位的Haar特征值。包括人脸、眼睛、嘴唇等等。

1、没有任何行为的 XML
XML 是不作为的。也许这有点难以理解,但是 XML 不会做任何事情。XML 被设计用来结构化、存储以及传输信息。
下面是 John 写给 George 的便签,存储为 XML:
<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>
上面的这条便签具有自我描述性。它拥有标题以及留言,同时包含了发送者和接受者的信息。但是,这个 XML 文档仍然没有做任何事情。它仅仅是包装在 XML标签中的纯粹的信息。我们需要编写软件或者程序,才能传送、接收和显示出这个文档。
2、XML 仅仅是纯文本
XML没什么特别的。它仅仅是纯文本而已。有能力处理纯文本的软件都可以处理 XML。不过,能够读懂 XML 的应用程序可以有针对性地处理 XML 的标签。标签的功能性意义依赖于应用程序的特性。
3、XML 无所不在
当我们看到 XML 标准突飞猛进的开发进度,以及大批的软件开发商采用这个标准的日新月异的速度时,真的是不禁感叹这真是令人叹为观止。目前,XML 在 Web 中起到的作用不会亚于一直作为 Web 基石的 HTML。XML 无所不在。XML 是各种应用程序之间进行数据传输的最常用的工具,并且在信息存储和描述领域变得越来越流行。XML的语法规则很简单,且很有逻辑。这些规则很容易学习,也很容易使用。 
(1)所有 XML 元素都须有关闭标签
(2)XML 标签对大小写敏感
(3)XML 必须正确地嵌套
(4)XML 文档必须有根元素

(5)XML 的属性值须加引号

HDF5文件

1.HDF5简介

       Hierarchical Data Format,可以存储不同类型的图像和数码数据的文件格式,并且可以在不同类型的机器上传输,同时还有统一处理这种文件格式的函数库。大多数普通计算机都支持这种文件格式。
     文件格式是指计算机存储和处理数据的方式 。目前常用的图像文件格式很多, 如 GIF , JPG , PCX ,TIFF 等 。这些格式共同的缺点是结构太简单 ,不能存放除影像信息外其他的有用数据 ,像遥感影像的坐标值、参数等都无法在其中保存,而且用不同格式存储影像数据使得读取、传输、共享变得复杂, 因此,有必要建立一种标准格式以解决上述问题。
       HDF(Hierarchical Data File)是美国国家高级计算应用中心为了满足各种领域研究需求而研制的一种能高效存储和分发科学数据的新型数据格式。HDF可以表示出科学数据存储和分布的许多必要条件。
       HDF5的产生与发展反映了HDF在不断适应现代计算机发展和数据处理日益庞大复杂的要求。HDF5紧跟时代变化也为其自身注入活力,使它被愈来愈多的领域采纳、运用 ,许多遥感影像采取HDF格式存取,一些大的图像处理软件也开始提供接口读取HDF文件。HDF强大的机制适应了遥感影像的特点,能够有条不紊、完备地保存遥感影像的属性和空间信息数据 , 同时使查询和提取相关数据也很方便容易。

       HDF 是一种功能强大 ,广泛运用于科学领域的文件格式。研究它的组织结构特别是HDF5 的组织结构对于处理和管理地理信息系统的海量图形数据和属性数据具有一定的借鉴作用。比如,掌握和运用NCSA提供的API提取影像数据 ,可以节省时间, 提高程序编写效率。


dat文件

dat简介

     dat文件一般是用来存放数据的文件,是01二进制数据文件,利用数据分析软件才能打开。但是dat并不是一个太统一的文件格式。
    .DAT并不是一种标准文件。许多软件都使用这个扩展名,但文件含义不同。而许多数据分析软件也用这个扩展名保存数据。所以这要看具体的软件情况来定。DAT文件,可以按照扩展名来看就是DATA的意思,即数据文件,这类文件并没有进行绝对化的定义,例如VCD光盘中的DAT文件就可以用一般的视频播放器打开,而QQ的DAT文件中则存储了用户信息,是无法使用常规方式打开的,只有QQ程序可以访问。还有一些其他程序都有自己对DAT文件的定义,要通过其特殊的程序来打开与之相关联的DAT文件。

参考资料

https://www.pianshen.com/article/1763897507/




我们建立了一个读者群,将在里面分享一些生信编程小知识,生物信息化学信息文献,欢迎加入:


以上是关于XMLHdf5dat等后缀文件的简介的主要内容,如果未能解决你的问题,请参考以下文章

[Linux养成计划]Linux简介

后缀数组简介与Golang实现

自定义 systemctl 管理服务

C++ 常用命令行开发工具(Linux)

广义后缀树(GST)算法的简介

MarkDown的使用简介