利用h5py存储数据

Posted yesuuu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了利用h5py存储数据相关的知识,希望对你有一定的参考价值。

两类容器:group & dataset

group类似文件夹,字典。 dataset是数据集,类似数组

支持更多的对外透明的存储特征,数据压缩,误差检测,分块传输

 

import h5py

读:

f = h5py.File(file, mode=‘r‘)

f.keys()

dset = f[‘mydataset‘]

写:

f = h5py.File(file, mode=‘w‘)

dset = f.create_dataset(name, dataOrSize, dtype, )

可选项:

chunks: True自动分块, 如果手动分块则输入元组

 

可以对数据块设置attrs

dset.attrs[‘abc‘] = 1

 

高级特性:

滤波器组?加入参数compression = ‘gzip‘

hdf5文件本身大小没有限制

一个dataSet最多32维, 每个维最多2^64个值

一个chunk最大4G,

 

以上是关于利用h5py存储数据的主要内容,如果未能解决你的问题,请参考以下文章

h5py矩阵存储精度

关闭打开的 h5py 数据文件

使用 H5Py 在 HDF5 中存储日期时间

使用 h5py 保存混合结构化数据

H5PY键读取缓慢

使用 h5py 将光栅图像添加到 HDF5 文件