fft - 如何有效地使用 fftw_plan_many_dft?
问题描述
我有大约 2000 个复杂的 fft(大小 2048)要计算,并且输入/输出缓冲区是连续分配的。因此,我自然会考虑使用fftw_plan_many_dft
以希望加速我的程序。
我很惊讶它fftw_plan_many_dft
比普通界面慢 10 倍。这些是我所做的
O2
使用带有标志的本机复杂类型和 gcc 编译器- 使用单精度,即 fftw f _
- 用于
fftwf_malloc()
内存分配 - 使用
FFTW_MEASURE
标志(FFTW_PATIENT
并且FFTW_EXHAUSTIVE
太长) - 使用 FFTW 3.3.8
这个问题众所周知吗?有什么我应该做的不同的事情吗?
解决方案
推荐阅读
- shopify - 如何在多个页面中使用一个部分而不创建它的副本[Shopify]?
- python - 通过 Web3.py 在 Infura 节点获取以太坊 txpool 待处理交易的不同方法
- apache-kafka - 将 2 个具有重叠时间范围的生产者请求合并为一个并返回 2 个原始请求
- python - 使用“或”运算符
- javascript - 引导模式在 React JS 中不起作用
- angular6 - array.filter 不返回过滤结果
- javascript - 在 XSLT 中定义和调用 Javascript 函数
- apache - 如何在 Apache 中重写 URL 路径以避免无限循环
- javascript - 如何使用 Angular 或 javascript 重新加载页面
- python - Travis-ci installs packages from requirements.txt file automatically