在 OpenMP 中，firstprivate 和 lastprivate 与 private 子句有何不同？

Posted 2023-02-19

技术标签:

【中文标题】在 OpenMP 中，firstprivate 和 lastprivate 与 private 子句有何不同？【英文标题】：How are firstprivate and lastprivate different than private clauses in OpenMP? 【发布时间】：2013-02-24 15:11:24 【问题描述】：

我查看了官方定义，但我仍然很困惑。

firstprivate：指定每个线程应该有自己的变量实例，并且该变量应该用变量的值初始化，因为它存在于并行构造之前。

对我来说，这听起来很像私人的。我找了一些例子，但我似乎不明白它有什么特别之处或如何使用它。

lastprivate：指定封闭上下文的变量版本设置为等于执行最终迭代（for-loop 构造）或最后一节（#pragma 节）的线程的私有版本。

由于以下示例，我觉得我对这一点的理解更好：

#pragma omp parallel

   #pragma omp for lastprivate(i)
      for (i=0; i<n-1; i++)
         a[i] = b[i] + b[i+1];

a[i]=b[i];

所以，在这个例子中，我知道lastprivate 允许i 在循环之外作为最后一个值返回。

我今天刚开始学习 OpenMP。

【问题讨论】：

【参考方案1】：

在初始化之前不能使用局部变量i，程序会报错，因为C++ 14 Standard。

【讨论】：

【参考方案2】：

firstprivate 和lastprivate 只是private 的特例。

第一个导致将来自外部上下文的值带入并行区域，而第二个导致将值从并行区域传输到外部上下文。

【讨论】：

你能提供任何关于它的参考吗？【参考方案3】：

private 变量未初始化，即它们像任何其他本地自动变量一样以随机值开始（并且它们通常使用每个线程堆栈上的自动变量来实现）。以这个简单的程序为例：

#include <stdio.h>
#include <omp.h>

int main (void)

    int i = 10;

    #pragma omp parallel private(i)
    
        printf("thread %d: i = %d\n", omp_get_thread_num(), i);
        i = 1000 + omp_get_thread_num();
    

    printf("i = %d\n", i);

    return 0;

使用四个线程，它会输出如下内容：

thread 0: i = 0
thread 3: i = 32717
thread 1: i = 32717
thread 2: i = 1
i = 10

(another run of the same program)

thread 2: i = 1
thread 1: i = 1
thread 0: i = 0
thread 3: i = 32657
i = 10

这清楚地表明i 的值在并行区域内是随机的（未初始化），并且在并行区域之后对其进行的任何修改都不可见（即变量保持其在进入该区域之前的值）。

如果将i 设为firstprivate，则使用并行区域之前的值对其进行初始化：

thread 2: i = 10
thread 0: i = 10
thread 3: i = 10
thread 1: i = 10
i = 10

在并行区域内对i的值的修改仍然不可见。

您已经了解lastprivate（它不适用于简单的演示程序，因为它缺少工作共享结构）。

所以是的，firstprivate 和 lastprivate 只是 private 的特例。第一个导致将来自外部上下文的值引入并行区域，而第二个将值从并行区域传输到外部上下文。这些数据共享类背后的基本原理是，在并行区域内，所有私有变量都隐藏了来自外部上下文的私有变量，即不可能使用赋值操作从并行区域内部修改i 的外部值。

【讨论】：

以上是关于在 OpenMP 中，firstprivate 和 lastprivate 与 private 子句有何不同？的主要内容，如果未能解决你的问题，请参考以下文章