首页 > 解决方案 > 并行内循环减慢程序

问题描述

我正在尝试将程序优化为实验。

当我并行化前两个外部循环(使用“it”和“i”)时,我发现执行时间存在显着差异。但是当我试图并行化最里面的循环时,程序变得比顺序循环慢得多。我也尝试过使用归约,但结果是一样的。

这是我应该期待的还是我在并行化上犯了一个错误?

当我使用“nowait”子句时,它比前两个并行化运行得更快。

#pragma omp parallel private(it,i,j) firstprivate(u,sigma,dt,mu)
{
for (it = 0; it < itime; it++) {

  for (i = 0; i < n; i++) {
    sum = 0.0;


    #pragma omp for schedule(static)
    for (j = 0; j < n; j+=1) {

      sum += sigma[i * n + j] * (u[j] - u[i]);
    }

    #pragma omp atomic write
   uplus[i]= (u[i] + dt * (mu - u[i])) + dt * sum / divide;

    if (u[i] > uth) {
      #pragma omp atomic write
      uplus[i] = 0.0;

      if (it >= ttransient) {
        #pragma omp atomic
        omega1[i] += 1.0;
      }
   }
}

}//omp end

标签: cperformanceopenmp

解决方案


推荐阅读