Chapel中的共享记忆n体仿真

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Chapel中的共享记忆n体仿真相关的知识,希望对你有一定的参考价值。

我正在尝试重新实现Peter Pacheco在“并行编程简介”第6.1.6章中介绍的n-body仿真的共享内存实现。在该章中,它是使用OpenMP实现的。

这是我使用OpenMP的并行实现。这是使用Chapel的串行实现。我在使用Chapel实现共享内存并行实现时遇到问题。由于无法在forall循环中获得线程的等级,因此我无法使用与OpenMP实现中相同的方法。我将不得不使用coforall循环,创建任务并手动分配迭代。这似乎并不实际,并表明在教堂内有一种更优雅的方法来解决这个问题。

我正在寻找有关如何使用Chapel提供的工具更好地解决此问题的指导和建议。

答案

我的建议是在你的forall循环中使用reduce intent上的一个(+)forces,它将为每个任务提供自己的forces私有副本,然后(sum)在任务完成时将其各自的副本减少回原始的forces变量。这可以通过将以下with-clause附加到forall循环来完成:

  forall q in 0..#n_bodies with (+ reduce forces) {

在这里,我寻找其他方法使代码更优雅,并建议从这个问题的2D数组更改为数组的数组,以便为​​x,y折叠一堆类似的代码语句,z组件下至单个语句。我还使用了你的pDomain变量并为[0..#3] real创建了一个类型别名,以便删除代码中的一些冗余。哦,我删除了useMath模块的IOs,因为它们是在Chapel程序中自动使用的。

这就是我离开的地方:

config const filename = "input.txt";
config const iterations = 100;
config const out_filename = "out.txt";
const X = 0;
const Y = 1;
const Z = 2;
const G = 6.67e-11;
config const dt = 0.1;

// Read input file, initialize bodies                                       
var f = open(filename, iomode.r);
var reader = f.reader();

var n_bodies = reader.read(int);
const pDomain = {0..#n_bodies};

type vec3 = [0..#3] real;

var forces: [pDomain] vec3;
var velocities: [pDomain] vec3;
var positions: [pDomain] vec3;
var masses: [pDomain] real;

for i in pDomain {
  positions[i] = reader.read(vec3);

  velocities[i] = reader.read(vec3);

  masses[i] = reader.read(real);
}

f.close();
reader.close();

for i in 0..#iterations {
  // Reset forces                                                           
  forces = [0.0, 0.0, 0.0];

  forall q in pDomain with (+ reduce forces) {
    for k in pDomain {
      if k <= q {
        continue;
      }
      var diff = positions[q] - positions[k];
      var dist = sqrt(diff[X]**2 + diff[Y]**2 + diff[Z]**2);
      var dist_cubed = dist**3;

      var tmp = -G * masses[q] * masses[k] / dist_cubed;
      var force_qk = tmp * diff;

      forces[q] += force_qk;
      forces[k] -= force_qk;
    }
  }


  forall q in pDomain {
    positions[q] += dt * velocities[q];
    velocities[q] += dt / masses[q] * forces[q];
  }
}

var outf = open(out_filename, iomode.cw);
var writer = outf.writer();

for q in pDomain {
  writer.writeln("%er %er %er %er %er %er".format(positions[q][X], positions[q][Y], positions[q][Z], velocities[q][X], velocities[q][Y], velocities[q][Z]));
}

writer.close();
outf.close();

您可以考虑进行的另一个更改是使用以下整个数组语句替换更新位置和速度的forall-loop:

    positions += dt * velocities;                                           
    velocities += dt / masses * forces;                                     

其中主要的权衡是forall将使用单个并行循环以融合方式实现语句,而整个数组语句则不会(至少在编译器的当前版本1.18版本中)。

以上是关于Chapel中的共享记忆n体仿真的主要内容,如果未能解决你的问题,请参考以下文章

如何优化C ++代码的以下片段 - 卷中的零交叉

C 中的共享内存代码片段

频谱共享基于认知无线电的VCG拍卖机制频谱共享算法的MATLAB仿真

海马体记忆训练:让你拥有超常记忆力

点散射方法进行混响仿真,信号为单频信号,散射体高斯分布,无多普勒频域

免疫优化物流选址基于MATLAB的免疫优化算法在物流配送中心选址中的应用仿真