如何使用 MPI_Scatter 和 MPI_Gather 计算多个进程的平均值?

Posted

技术标签:

【中文标题】如何使用 MPI_Scatter 和 MPI_Gather 计算多个进程的平均值?【英文标题】:How to calculate average across multiple processes using MPI_Scatter and MPI_Gather? 【发布时间】:2021-04-08 11:52:13 【问题描述】:

我正在尝试制作一个迷你 C 程序来理解 MPI,我想让用户输入程序将接收多少个数字,这些数字,然后 scatter 在进程中同样输入它们。然后每个进程将计算它的局部平均值,然后使用gather 根进程将计算整个平均值。这些数字存储在一个固定大小的数组中。我遇到的问题是根进程没有计算平均值,我不知道为什么。正如我在其他示例中看到的那样,我分散并收集了数字,但我无法让它发挥作用。这就是我所拥有的。

#include <stdio.h>
#include "mpi.h"

int main(int argc, char** argv)
int my_rank;
int p;
int n;
int i;
int size;
int loc_num;
int loc_sum;
int fin=0;
int avg;
int loc_avg;
int root=0;
int data[100];
int data_loc[100];
int data_aver[100];
int final_res[100];

MPI_Init(&argc, &argv);
MPI_Comm_rank(MPI_COMM_WORLD, &my_rank);
MPI_Comm_size(MPI_COMM_WORLD, &p);

if (my_rank == 0)
    printf("Input how many numbers: ");
    scanf("%d", &n);
    
    printf("Input the elements of the array: ");
    for(i=0; i<n; i++)
        scanf("%d", &data[i]);
    

 
MPI_Bcast(&n, 1, MPI_INT, root, MPI_COMM_WORLD);

loc_num = n/p;

MPI_Scatter(&data, loc_num, MPI_INT, data_loc, loc_num, MPI_INT, root, MPI_COMM_WORLD);


for(i=0; i< loc_num; i++)
    loc_sum += data_loc[i];
    loc_avg = loc_sum / loc_num;
     


if(my_rank==0)

    MPI_Gather(&loc_avg, loc_num, MPI_INT, final_res, loc_num, MPI_INT, root, MPI_COMM_WORLD);

    for(i=0; i<n; i++)
        fin += final_res[i];
    
    avg=fin/n;

    printf("Final average: %d \n", avg);

MPI_Finalize();
return 0;

【问题讨论】:

【参考方案1】:

您的代码存在一些小问题,即未使用的变量和未初始化的变量。您应该使用一些warning flags 编译您的代码,例如-Wall-pedantic 等。那些警告用户上述问题的标志。

此外,您可以更改此设置:

for(i=0; i< loc_num; i++)
    loc_sum += data_loc[i];
    loc_avg = loc_sum / loc_num;
  

for(i=0; i< loc_num; i++)
    loc_sum += data_loc[i];
   
loc_avg = loc_sum / loc_num;

您需要将变量loc_sum 初始化为零,因为代码第一次与该变量交互是执行loc_sum += data_loc[i];,否则是undefined behavior。

由于平均值可以是浮点数,变量loc_avg avgfin 的数据类型应该是float 作为类型(或双精度)而不是int

您仅由主人调用MPI_Gather

if(my_rank==0)

    MPI_Gather(&loc_avg, loc_num, MPI_INT, final_res, loc_num, MPI_INT, root, MPI_COMM_WORLD);

    for(i=0; i<n; i++)
        fin += final_res[i];
    
    avg=fin/n;

    printf("Final average: %d \n", avg);

MPI_Gather 是一个收集通信指令,它应该被组内的所有进程调用。此外,您使用错误的参数调用 MPI_Gather,而不是:

MPI_Gather(&loc_avg, loc_num, MPI_INT, final_res, loc_num, MPI_INT, root, MPI_COMM_WORLD);

调用

MPI_Gather(&loc_avg, 1, MPI_FLOAT, final_res, 1, MPI_FLOAT, root, MPI_COMM_WORLD);

这个loc_num = n/p;只有在输入可以在进程之间平均分配时才能正常工作,但是(例如)如果你有104的输入,进程loc_num = n/p;将等于2,所以每个进程将计算 2 of 10。因此,所有进程将计算 8 而不是 10。这个我留给你解决。或者,您可以假设 n/p 始终生成一个自然数。

最后,代替:

for(i=0; i<n; i++)
    fin += final_res[i];

 avg=fin/n;

你应该有

for(i=0; i<p; i++)
    fin += final_res[i];
 
 avg=fin/p;

您想要sum 所有进程的本地平均值,因此使用进程总数“p”,而不是输入数组“n”的大小。

一些建议:

    如果可以,将变量声明为尽可能接近使用它们的代码; 为您的变量提供更好的名称,例如,代替“n”和“p”,分别称为 input_size 和“total_processes”。

IMO 这提高了代码的可读性。通过所有这些更改,您的代码将如下所示:

#include <stdio.h>
#include "mpi.h"

int main(int argc, char** argv)
    int my_rank;
    int total_processes;
    int root = 0;
    int data[100];
    int data_loc[100];
    float final_res[100];

    MPI_Init(&argc, &argv);
    MPI_Comm_rank(MPI_COMM_WORLD, &my_rank);
    MPI_Comm_size(MPI_COMM_WORLD, &total_processes);

    int input_size = 0;
    if (my_rank == 0)
       printf("Input how many numbers: ");
       scanf("%d", &input_size);
    
       printf("Input the elements of the array: ");
       for(int i=0; i<input_size; i++)
           scanf("%d", &data[i]);
       
    
 
    MPI_Bcast(&input_size, 1, MPI_INT, root, MPI_COMM_WORLD);

    int loc_num = input_size/total_processes;

    MPI_Scatter(&data, loc_num, MPI_INT, data_loc, loc_num, MPI_INT, root, MPI_COMM_WORLD);

    int loc_sum = 0;
    for(int i=0; i< loc_num; i++)
        loc_sum += data_loc[i];     
    float loc_avg = (float) loc_sum / (float) loc_num;
    MPI_Gather(&loc_avg, 1, MPI_FLOAT, final_res, 1, MPI_FLOAT, root, MPI_COMM_WORLD);

    if(my_rank==0)
      float fin = 0;
      for(int i=0; i<total_processes; i++)
         fin += final_res[i];
      float avg = fin / (float) total_processes;
      printf("Final average: %f \n", avg);
    
    MPI_Finalize();
    return 0;

测试输入: 10 个元素,元素为1,2,3,4,5,6,7,8

结果:

PROCESS=0 loc_avg=1.5 1, 2 
PROCESS=1 loc_avg=3.5 3, 4
PROCESS=2 loc_avg=5.5 5, 6
PROCESS=3 loc_avg=7.5 7, 8

Final average: 4.500000

【讨论】:

以上是关于如何使用 MPI_Scatter 和 MPI_Gather 计算多个进程的平均值?的主要内容,如果未能解决你的问题,请参考以下文章

如何在 MPI_Scatter 的数组中分散多个变量

使用 MPI_Send 和 MPI_Recv 实现 MPI_Scatter 的问题

C 中的 MPI_Scatter 结构

MPI_SCATTER Fortran 矩阵(按行)

将 MPI_Scatter 与 MPI_Type_vector 一起使用时列的意外分布

mpi 进程在信号 11 上退出