H5文件读取

Posted 神遁克里苏

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了H5文件读取相关的知识,希望对你有一定的参考价值。

H5文件读取:

import torch.utils.data as data
import torch
import h5py

class DatasetFromHdf5(data.Dataset):
    def __init__(self, file_path):
        super(DatasetFromHdf5, self).__init__()
        hf = h5py.File(file_path)
        self.data = hf.get('data')
        self.target = hf.get('label')


    def __getitem__(self, index):
        return torch.from_numpy(self.data[index,:,:,:]).float(), torch.from_numpy(self.target[index,:,:,:]).float()


    def __len__(self):
        return self.data.shape[0]

调用的时候,先用DataLoader将数据装入 training_data_loader中

 train_set = DatasetFromHdf5(r"D:\\PycharmProjects\\pytorch-vdsr-master\\data\\train.h5")
 training_data_loader = DataLoader(dataset=train_set, num_workers=opt.threads, batch_size=opt.batchSize, shuffle=True)

在使用数据训练的时候写一个循环,iteration只是一个计数的,从1开始计数,表示已经取第iteration个批次了,batch就是每次取出一个批次的数值。

input和target是取出的输入和希望得到的输出,这里的返回顺序是在上边的DatasetFromHdf5中定义的。

 def __getitem__(self, index):
        return torch.from_numpy(self.data[index,:,:,:]).float(), torch.from_numpy(self.target[index,:,:,:]).float()

所以batch[0]表示input(也就是存储的data),batch[1]表示label(也就是label)。
index在这里应该是每次按第一个维度取出data中的数值。data[index,:,:,:],本来是维度是1000×1×41×41,每次取的是1×1×41×41。按照batch来,每次取出的就是batch×1×41×41

  for iteration, batch in enumerate(training_data_loader, 1):
        input, target = Variable(batch[0]), Variable(batch[1], requires_grad=False)

以上是关于H5文件读取的主要内容,如果未能解决你的问题,请参考以下文章

Caffe 未读取所有 h5 文件

H5文件读取

H5读取本地文件操作

利用matlab展示并读取.h5文件内容

python写入和读取h5、pkl、mat 文件

随机读取 .h5 文件中的元素而不加载整个矩阵