h5文件简介

Posted abella

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了h5文件简介相关的知识,希望对你有一定的参考价值。

h5文件是层次格式的第5代版本,用于存储科学数据的一种文件格式和库文件,由美国超级计算中心与应用中心研发的文件格式,用以存储和组织大规模数据.

H5将文件结构简化成两个主要的对象类型:

1 数据集dataset,就是同一类型数据的多维数组

2 组group,是一种容器结构,可以包含数据集和其他组,若一个文件中存放了不同种类的数据集,这些数据集的管理就用到了group

直观的理解,可以参考我们的文件系统,不同的文件存放在不同的目录下:

目录就是hdf5文件中的group,描述了数据集DataSet的分类信息,通过group有效的将多种dataset进行管理和划分

文件就是hdf5文件中的dataset,表示具体的数据

下图就是数据集和组的关系:

技术图片

 

h5文件是一种真正的层次结构,文件系统式的数据类型.另外在数据集中还有元数据,即metadata

对于每一个dataset而言,除了数据本身之外,这个数据集还有很多的属性信息.在hdf5中,同时支持存储数据集对应的属性信息,所有的属性信息的集合叫做metaData,下图是h5文件的数据集的构成

技术图片

在pandas中读写hdf文件时,指定的key值指的是hdf文件中的group,

1 read_hdf(path_or_bufkey=Nonemode=‘r‘**kwargs)

当要读取得h5文件中,只包含一个group时,可将key参数省略

2 to_hdf(path_or_bufkey**kwargs)

当写入h5文件时,必须指定写入的组,即key值不能省略

 

以上是关于h5文件简介的主要内容,如果未能解决你的问题,请参考以下文章

如何合并多个 .h5 文件?

Caffe 未读取所有 h5 文件

H5拖放+FormData接口+NodeJS,完整异步文件上传

Python 无法打开 .h5 文件

云原生之使用Docker部署h5ai文件展示页

python写入和读取h5、pkl、mat 文件