分段错误:C++ 中的结构序列化和 MPI 数据传输

Posted

技术标签:

【中文标题】分段错误:C++ 中的结构序列化和 MPI 数据传输【英文标题】:Segmentation Fault: Struct Serialisation and MPI Data Transfer in C++ 【发布时间】:2019-10-23 18:10:44 【问题描述】:

我正在尝试将序列化结构从一个等级发送到另一个等级。结果是

分段错误:11

我不知道它是从哪里来的。

我试图通过打印出一些值来定位问题,并且代码总是在MPI_SendMPI_Recv 之间中断,但由于它是分段错误,因此无法确定它是问题的根源。请赐教。

int N = 11;
struct tests
    int number;
    double *fx;
;

void locateMemoryTests(struct tests *t)
    t->fx = (double*) malloc(N*sizeof(double));


void he(struct tests *t, int N)
    int NRank, MyRank;
    MPI_Comm_rank( MPI_COMM_WORLD, &MyRank );
    MPI_Comm_size( MPI_COMM_WORLD, &NRank );
    int st = MyRank * int(N/2);
    int en = (MyRank+1) * int(N/2) + (N%2)*MyRank;

    for (int i=st; i<en; i++)
        t->fx[i] = i*i + 5*(i + t->number);
    
    const int nitems        = 2;
    int blocklengths[2]     = 1, N;
    MPI_Datatype types[2]   = MPI_INT, MPI_DOUBLE;
    MPI_Datatype mpi_tests_type;
    MPI_Aint offsets[2];

    offsets[0] = offsetof(tests, number);
    offsets[1] = offsetof(tests, fx);

    MPI_Type_create_struct(nitems, blocklengths, offsets, types, &mpi_tests_type);
    MPI_Type_commit(&mpi_tests_type);
    MPI_Comm_rank(MPI_COMM_WORLD, &MyRank);

    if (MyRank == 0)
        struct tests send;
        send.number = t->number;
        locateMemoryTests(&send);

        for (int i=0; i<N; i++)
            send.fx[i] = t->fx[i];
           

        MPI_Send(&send, 2, mpi_tests_type, 1, 111, MPI_COMM_WORLD);
        
    else if (MyRank == 1)
        MPI_Status status;
        struct tests recv;
        locateMemoryTests(&recv);
        MPI_Recv(&recv, 2, mpi_tests_type, 0, 111, MPI_COMM_WORLD, &status);

    MPI_Type_free(&mpi_tests_type);



int main( int argc, char *argv[] )
    int NRank, MyRank;
    MPI_Init( &argc, &argv );
    MPI_Comm_rank( MPI_COMM_WORLD, &MyRank );
    MPI_Comm_size( MPI_COMM_WORLD, &NRank );

    struct tests tt;
    tt.number = 5;
    locateMemoryTests(&tt);

    he(&tt,N);

    MPI_Finalize();
    return 0;

【问题讨论】:

MPI_Recv接收两个元素,但是recv变量只能容纳一个? 发送/接收具有多个元素的结构不是序列化的目的吗?或者你的意思是我只能发送一种元素?我了解到,在这种情况下,“int count”应该是我的结构从***.com/questions/18165277/… 获得的数据种类的数量 我的意思是你想要两个元素,但只为一个元素准备了存储空间。 您能详细说明一下吗?我是 C++ 新手,我不太清楚为什么我只为一个而不是两个准备存储。 尝试结构测试recv[2];和结构测试发送[2];看看有没有什么不同。 【参考方案1】:

您的 MPI 派生数据类型描述了以下 C struct

struct tests
    int number;
    double fx[N];
;

但你使用的是不同的

struct tests
    int number;
    double *fx;
;

如果N不是常量,你可以声明

struct tests
    int number;
    double fx[];
;

您可以正确分配这样的struct

另一种选择是保持相同的struct 定义,并手动将MPI_Pack()MPI_Unpack() 数据传入/传出临时缓冲区。

【讨论】:

以上是关于分段错误:C++ 中的结构序列化和 MPI 数据传输的主要内容,如果未能解决你的问题,请参考以下文章

MPI Send 给出分段错误

C++ 中的 MPI_Send MPI_Recv 段错误

使用 MPI_Bcast 时出现 MPI 分段错误

MPI_DOUBLE_INT 和 C++ 结构

在 C++ 中使用排序运算符 < 定义 MPI 结构

MPI calloc 导致分段错误