首页 > 解决方案 > FFTW OpenMP 并行化?

问题描述

我在使用 FFTW 创建并行 OMP DFT 时遇到了一些麻烦。我使用 --enable-openmp 编译并具有以下代码示例:

#include <fftw3.h>

int NUMBER_OF_THREADS = 40;
fftw_init_threads();
fftw_plan_with_nthreads(NUMBER_OF_THREADS);

std::vector<std::complex<double>> buf(num_trials);
fftw_plan p = fftw_plan_dft_1d(num_trials, reinterpret_cast<fftw_complex*>(buf.data()), reinterpret_cast<fftw_complex*>(buf.data()), -1, FFTW_MEASURE);

// plan is called here sequentially some number of times
for (dummy in dummy) {
   fftw_execute(p);
}

fftw_destroy_plan(p);

不幸的是,代码似乎没有并行化。我在 Makefile 中使用了以下标志:

CXXFLAGS = -fopenmp -O3 -std=c++17 -funroll-loops -march=native -Wno-unused -Wall -I. -g
LDFLAGS = -I /usr/local/include -L /usr/local/lib -lfftw3_omp -lfftw3 -lm

是否有详细说明如何使用 OpenMP FFTW 的可用代码示例?我在这里做错了什么?参考 FFTW 文档

标签: c++fftw

解决方案


  1. -fopenmp是(也是?)链接器标志。将它(或复制,以确保安全)CXXFLAGSLDFLAGS. 我希望这会有所帮助。
  2. 不太重要:-I /usr/include对链接器没有影响;将其移至 CXXFLAGS(或在不必要时删除)

推荐阅读