不了解使用最大运算 OpenMP 程序并行减少的输出?

Posted

技术标签:

【中文标题】不了解使用最大运算 OpenMP 程序并行减少的输出?【英文标题】:Didn't understand the output from parallel reduction using max operation OpenMP program? 【发布时间】:2021-05-02 14:16:45 【问题描述】:

我在阅读有关并行编程的内容时遇到了这个基本代码。 这是使用最大操作的并行缩减程序。我们对这次行动的期望究竟是什么?

 
 #include <stdio.h>

 #include <omp.h>

 int main() 
   double arr[10];
   omp_set_num_threads(4);
   double max_val = 0.0;
   int i;
   for (i = 0; i < 10; i++)
     arr[i] = 2.0 + i;
   #pragma omp parallel
   for reduction(max: max_val)
   for (i = 0; i < 10; i++) 
     printf("thread id = %d  and i = %d \n", omp_get_thread_num(), i);
     if (arr[i] > max_val) 
       max_val = arr[i];
     
   
   printf("\nmax_val = %f", max_val);
 
  

这是输出

thread id = 2  and i = 6
thread id = 2  and i = 7
thread id = 1  and i = 3
thread id = 1  and i = 4
thread id = 1  and i = 5
thread id = 3  and i = 8
thread id = 3  and i = 9
thread id = 0  and i = 0
thread id = 0  and i = 1
thread id = 0  and i = 2

max_val = 11.000000

我是 openmp 新手。请帮助我理解这段代码。我没有得到这个输出。这个结果是怎么来的?

【问题讨论】:

【参考方案1】:

您的代码填满了arr

   int i;
   for (i = 0; i < 10; i++)
     arr[i] = 2.0 + i;

使用来自2 to 11的值:

然后在并行循环中:

   #pragma omp parallel for reduction(max: max_val)
   for (i = 0; i < 10; i++) 
     printf("thread id = %d  and i = %d \n", omp_get_thread_num(), i);
     if (arr[i] > max_val) 
       max_val = arr[i];
     
   

当 OpenMP 读取 #pragma omp parallel for OpenMP 会将循环的迭代在团队之间划分为线程,在您的情况下为 4 个线程:

 omp_set_num_threads(4);

关于#pragma omp parallel#pragma omp parallel for的更详细解答可以在here找到。

使用reduction(max: max_val),OpenMP 将创建变量max_val 的副本每个 线程,在并行区域之后,原始变量max_val 将等于所有线程中最大的max_val .在你的情况下是11.0

关于reduction 子句的更详细解答可以在here找到。

函数omp_get_thread_num()返回调用该方法的线程的ID。

【讨论】:

以上是关于不了解使用最大运算 OpenMP 程序并行减少的输出?的主要内容,如果未能解决你的问题,请参考以下文章

C++ openmp并行程序在多核linux上如何最大化使用cpu

减少 OpenMP 中的数组

OpenMP/C++:并行 for 循环,之后减少 - 最佳实践?

开始尝试在 Win7 下使用 OpenMP 编写 fortran 并行程序

并行任务中的 C++ OpenMP 变量可见性

并行计算开发了解