在 OpenMP 中,firstprivate 和 lastprivate 与 private 子句有何不同?

Posted

技术标签:

【中文标题】在 OpenMP 中,firstprivate 和 lastprivate 与 private 子句有何不同?【英文标题】:How are firstprivate and lastprivate different than private clauses in OpenMP? 【发布时间】:2013-02-24 15:11:24 【问题描述】:

我查看了官方定义,但我仍然很困惑。

firstprivate:指定每个线程应该有自己的变量实例,并且该变量应该用变量的值初始化,因为它存在于并行构造之前。

对我来说,这听起来很像私人的。我找了一些例子,但我似乎不明白它有什么特别之处或如何使用它。

lastprivate:指定封闭上下文的变量版本设置为等于执行最终迭代(for-loop 构造)或最后一节(#pragma 节)的线程的私有版本。

由于以下示例,我觉得我对这一点的理解更好:

#pragma omp parallel

   #pragma omp for lastprivate(i)
      for (i=0; i<n-1; i++)
         a[i] = b[i] + b[i+1];

a[i]=b[i];

所以,在这个例子中,我知道lastprivate 允许i 在循环之外作为最后一个值返回。

我今天刚开始学习 OpenMP。

【问题讨论】:

【参考方案1】:

在初始化之前不能使用局部变量i,程序会报错,因为C++ 14 Standard。

【讨论】:

【参考方案2】:

firstprivatelastprivate 只是private 的特例。

第一个导致将来自外部上下文的值带入并行区域,而第二个导致将值从并行区域传输到外部上下文。

【讨论】:

你能提供任何关于它的参考吗?【参考方案3】:

private 变量未初始化,即它们像任何其他本地自动变量一样以随机值开始(并且它们通常使用每个线程堆栈上的自动变量来实现)。以这个简单的程序为例:

#include <stdio.h>
#include <omp.h>

int main (void)

    int i = 10;

    #pragma omp parallel private(i)
    
        printf("thread %d: i = %d\n", omp_get_thread_num(), i);
        i = 1000 + omp_get_thread_num();
    

    printf("i = %d\n", i);

    return 0;

使用四个线程,它会输出如下内容:

thread 0: i = 0
thread 3: i = 32717
thread 1: i = 32717
thread 2: i = 1
i = 10

(another run of the same program)

thread 2: i = 1
thread 1: i = 1
thread 0: i = 0
thread 3: i = 32657
i = 10

这清楚地表明i 的值在并行区域内是随机的(未初始化),并且在并行区域之后对其进行的任何修改都不可见(即变量保持其在进入该区域之前的值)。

如果将i 设为firstprivate,则使用并行区域之前的值对其进行初始化:

thread 2: i = 10
thread 0: i = 10
thread 3: i = 10
thread 1: i = 10
i = 10

在并行区域内对i的值的修改仍然不可见。

您已经了解lastprivate(它不适用于简单的演示程序,因为它缺少工作共享结构)。

所以是的,firstprivatelastprivate 只是 private 的特例。第一个导致将来自外部上下文的值引入并行区域,而第二个将值从并行区域传输到外部上下文。这些数据共享类背后的基本原理是,在并行区域内,所有私有变量都隐藏了来自外部上下文的私有变量,即不可能使用赋值操作从并行区域内部修改i 的外部值。

【讨论】:

以上是关于在 OpenMP 中,firstprivate 和 lastprivate 与 private 子句有何不同?的主要内容,如果未能解决你的问题,请参考以下文章

OpenMP 和 Python

结合 OpenMP 和 OpenCL

在混合 MPI/OpenMP 中进行 MPI 调用的线程

OpenMP用法大全

OpenMP 和 MPI 交互

OpenMP基本概念转