在 MPI 中发送和接收数组

Posted 2023-03-27

技术标签:

【中文标题】在 MPI 中发送和接收数组【英文标题】：send and receive array in MPI 【发布时间】：2018-11-11 11:17:08 【问题描述】：

我是 MPI 新手，正在编写一个简单的 MPI 程序来获取矩阵和向量的点积，即 A*b=c。但是，我的代码不起作用。源代码如下。

如果我将 A、b、c 和缓冲区的声明替换为

double A[16], b[4], c[4], buffer[8];

并注释与分配和释放操作相关的那些行，我的代码有效并且结果是正确的。在这种情况下，我在想问题应该与指针有关，但我不知道如何解决问题。

还有一点，在我的代码中，buffer只有4个元素，但是buffer的大小必须大于8，否则不起作用。

#include<mpi.h>
#include<iostream>
#include<stdlib.h>

using namespace std;

int nx = 4, ny = 4, nxny;
int ix, iy;
double *A = nullptr, *b = nullptr, *c = nullptr, *buffer = nullptr;
double ans;

// info MPI
int myGlobalID, root = 0, numProc;
int numSent;
MPI_Status status;

// functions
void get_ixiy(int);

int main()

  MPI_Init(NULL, NULL);
  MPI_Comm_size(MPI_COMM_WORLD, &numProc);
  MPI_Comm_rank(MPI_COMM_WORLD, &myGlobalID);

  nxny = nx * ny;

  A = new double(nxny);
  b = new double(ny);
  c = new double(nx);
  buffer = new double(ny);

  if(myGlobalID == root)
    // init A, b
    for(int k = 0; k < nxny; ++k)
      get_ixiy(k);
      b[iy] = 1;
      A[k] = k;
    
    numSent = 0;

    // send b to each worker processor
    MPI_Bcast(&b, ny, MPI_DOUBLE, root, MPI_COMM_WORLD);

    // send a row of A to each worker processor, tag with row number
    for(ix = 0; ix < min(numProc - 1, nx); ++ix)
      for(iy = 0; iy < ny; ++iy)
        buffer[iy] = A[iy + ix * ny];
      
      MPI_Send(&buffer, ny, MPI_DOUBLE, ix+1, ix+1, MPI_COMM_WORLD);
      numSent += 1;
    

    for(ix = 0; ix < nx; ++ix)
      MPI_Recv(&ans, 1, MPI_DOUBLE, MPI_ANY_SOURCE, MPI_ANY_TAG, MPI_COMM_WORLD, &status);
      int sender = status.MPI_SOURCE;
      int ansType = status.MPI_TAG;
      c[ansType] = ans;

      // send another row to worker process
      if(numSent < nx)
        for(iy = 0; iy < ny; ++iy)
          buffer[iy] = A[iy + numSent * ny];
        
        MPI_Send(&buffer, ny, MPI_DOUBLE, sender, numSent+1, 
        MPI_COMM_WORLD);
        numSent += 1;
      
      else
        MPI_Send(MPI_BOTTOM, 0, MPI_DOUBLE, sender, 0, MPI_COMM_WORLD);
    

    for(ix = 0; ix < nx; ++ix)
      std::cout << c[ix] << " ";
    
    std::cout << std::endl;

    delete [] A;
    delete [] b;
    delete [] c;
    delete [] buffer;
  
  else
    MPI_Bcast(&b, ny, MPI_DOUBLE, root, MPI_COMM_WORLD);
      if(myGlobalID <= nx)
        while(1)
          MPI_Recv(&buffer, ny, MPI_DOUBLE, root, MPI_ANY_TAG, MPI_COMM_WORLD, &status);
          if(status.MPI_TAG == 0) break;
          int row = status.MPI_TAG - 1;
          ans = 0.0;

          for(iy = 0; iy < ny; ++iy) ans += buffer[iy] * b[iy];

          MPI_Send(&ans, 1, MPI_DOUBLE, root, row, MPI_COMM_WORLD);
      
    
  

  MPI_Finalize();
  return 0;
 // main

void get_ixiy(int k)
  ix = k / ny;
  iy = k % ny;

错误信息如下。

=   BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES
=   PID 7455 RUNNING AT ***
=   EXIT CODE: 11
=   CLEANING UP REMAINING PROCESSES
=   YOU CAN IGNORE THE BELOW CLEANUP MESSAGES

YOUR APPLICATION TERMINATED WITH THE EXIT STRING: Segmentation fault: 
11 (signal 11)
This typically refers to a problem with your application.
Please see the FAQ page for debugging suggestions

【问题讨论】：

b[k] = 1时出现数组溢出。我建议您保持代码简单并声明double A[4][4] @GillesGouaillardet 非常感谢您的评论，我已经更正了这一行，但仍然存在问题。之所以要声明double *A，是因为以后要处理动态数组。如果您发送/接收/bcast 一个数组，缓冲区是数组，不是它的地址。例如，应该是MPI_Bcast(b, ...) 而不是 ...(&b) @GillesGouaillardet 感谢您的评论，我更正了这个错误并且代码有效。非常感谢！ 【参考方案1】：

您的代码中有几个问题，您必须先解决这些问题。

首先，你想访问一个不存在的b[]元素，在这个for循环中：

for(int k = 0; k < nxny; ++k)
  get_ixiy(k);
  b[k] = 1;     // WARNING: this is an error
  A[k] = k;

其次，您正在删除仅为根进程分配的内存。这会导致内存泄漏：

if(myGlobalID == root)
  // ...
  delete [] A;
  delete [] b;
  delete [] c;
  delete [] buffer;

您必须删除为所有进程分配的内存。

第三，你有一个无用的函数void get_ixiy(int);，它改变了全局变量ix，iy。这是无用的，因为在调用此函数后，您永远不会使用 ix, iy 直到您手动更改它们。见这里：

for(ix = 0; ix < min(numProc - 1, nx); ++ix)
    for(iy = 0; iy < ny; ++iy)
        // ...

第四，您以完全错误的方式使用MPI_Send() 和MPI_Recv()。你很幸运没有遇到更多错误。

【讨论】：

感谢您的 cmets，他们很有帮助。

以上是关于在 MPI 中发送和接收数组的主要内容，如果未能解决你的问题，请参考以下文章