如何使用可变长度类型将包含多个 std::vector<float> 的结构写出到 HDF5?

Posted

技术标签:

【中文标题】如何使用可变长度类型将包含多个 std::vector<float> 的结构写出到 HDF5?【英文标题】:How to write out struct containing multiple std::vector<float> to HDF5 using variable length type? 【发布时间】:2017-04-04 20:10:02 【问题描述】:

我正在尝试将 c-struct(描述虚拟“事件”)写入 HDF5 格式。该结构包含 4 个浮点向量,每个事件具有不同的长度(这些事件将在 HDF5 文件中组合在一起),因此应使用可变长度类型将其写入文件。但是,在使用“缓冲区结构”写入数据后,只有每隔一个向量才会写入文件(下面代码中的 1 和 3)。其他为无。我做错了什么?

#include <iostream>
#include <vector>
#include <cstdlib>
#include <string>
#include "H5Cpp.h"

const char * FILE_NAME = "test.h5";

const double HI   =  300.0;
const double LO   = -20.0;

typedef struct

    int ID;
    float energy;
    std::vector<float> v1, v2, v3, v4;
 event_struct;

typedef struct

    int ID;
    float energy;
    hvl_t v1Handle, v2Handle, v3Handle, v4Handle;
 event_struct_buffer;

int main(void)

    event_struct* event = new event_struct();

    event_struct_buffer* event_buffer = new event_struct_buffer();

    event->ID = 5;
    event->energy = 23.45;

    int n1 = 10;
    int n2 = 8;
    int n3 = 4;
    int n4 = 2;

    for( int i = 0;  i < n1; ++i )
        float x = LO + static_cast <float> (rand()) /( static_cast <float> (RAND_MAX/(HI-LO)));
        event->v1.push_back(x);
        std::cout << x << ' ';
        if( i < n2 )
            event->v2.push_back(x/2);
            if( i < n3 )
                event->v3.push_back(x/3);
                if( i < n4 )
                    event->v4.push_back(x/5);
                
            
        
    // end for loop
    std::cout << std::endl;

    hid_t      event_tid;                          /* File datatype identifier */
    hid_t      file, dataset, space, vlen_tid;  /* Handles */
    hsize_t    dim[] = 1;                /* Dataspace dimensions */

    int rank = sizeof(dim) / sizeof(hsize_t);
    std::cout << "Rank = " << rank << std::endl;

    space = H5Screate_simple(rank, dim, NULL);

    file = H5Fcreate(FILE_NAME, H5F_ACC_TRUNC, H5P_DEFAULT, H5P_DEFAULT);

    vlen_tid = H5Tvlen_create(H5T_NATIVE_FLOAT);

    event_tid = H5Tcreate( H5T_COMPOUND, sizeof(event_struct_buffer) );
    H5Tinsert(event_tid, "Event_ID", HOFFSET(event_struct_buffer, ID), H5T_NATIVE_INT);
    H5Tinsert(event_tid, "Energy", HOFFSET(event_struct_buffer, energy), H5T_NATIVE_FLOAT);
    H5Tinsert(event_tid, "Image1", HOFFSET(event_struct_buffer, v1Handle), vlen_tid);
    H5Tinsert(event_tid, "Image2", HOFFSET(event_struct_buffer, v2Handle), vlen_tid);
    H5Tinsert(event_tid, "Image3", HOFFSET(event_struct_buffer, v3Handle), vlen_tid);
    H5Tinsert(event_tid, "Image4", HOFFSET(event_struct_buffer, v4Handle), vlen_tid);

    dataset = H5Dcreate(file, "/Events_List", event_tid, space, H5P_DEFAULT, H5P_DEFAULT, H5P_DEFAULT);

    event_buffer->ID = event->ID;
    event_buffer->energy = event->energy;
    event_buffer->v1Handle.len = event->v1.size();
    event_buffer->v1Handle.p = event->v1.data();
    event_buffer->v2Handle.len = event->v2.size();
    event_buffer->v2Handle.p = event->v2.data();
    event_buffer->v3Handle.len = event->v3.size();
    event_buffer->v3Handle.p = event->v3.data();
    event_buffer->v4Handle.len = event->v4.size();
    event_buffer->v4Handle.p = event->v4.data();

    H5Dwrite(dataset, event_tid, H5S_ALL, H5S_ALL, H5P_DEFAULT, event_buffer);

    H5Tclose(event_tid);
    H5Tclose(vlen_tid);
    H5Sclose(space);
    H5Dclose(dataset);
    H5Fclose(file);
    return 0;

数字的伪rand列表是:

-19.9975 22.0921 221.794 126.768 150.486 50.0669 -4.94572 197.237 197.375 279.102

我在使用 h5py 读取 HDF5 文件时得到的输出是:

[ (5, 23.450000762939453, [-19.997495651245117, 22.09209442138672, 221.793701171875, 
126.76803588867188, 150.4855194091797, 50.06694030761719, -4.945722579956055, 
197.23670959472656, 197.37486267089844, 279.1017150878906],
[-6.665832042694092, 7.3640313148498535, 73.93123626708984, 42.256011962890625], None, None)]

感谢您的帮助。

【问题讨论】:

【参考方案1】:

问题实际上是使用 h5py(以及表格)读取 h5 文件。 运行h5dump test.h5 时,所有向量和所有事件中的数据结构和值(我最终编写了一个 event_struct 的向量,每个事件中有 4 个可变长度 std::vector)被正确填充。 我也只使用一个结构并将 hvl_t 句柄添加到 event_struct。

【讨论】:

以上是关于如何使用可变长度类型将包含多个 std::vector<float> 的结构写出到 HDF5?的主要内容,如果未能解决你的问题,请参考以下文章

如何声明和定义具有多个可变长度数组的结构?

MQTT控制---subscribe

指针数组中的 C++ 错误

如何将一个数组拆分成多个固定长度的数组

创建一个具有可变长度数组的接口,其中包含 TypeScript/Angular4 中的对象

如何将 std::accumulate 用于矩阵