simd - 英特尔 SIMD 内在函数:_mm256_i64scatter_pd
问题描述
我在编译英特尔 SIMD 分散内在函数时遇到问题。我已将原始代码简化为:
double *tmpMemoryDoubles= (double *) malloc(1024);
__m256i tmpRegisterIndex = _mm256_set_epi64x(0, 1, 2, 3);
__m256d tmpRegisterDouble = _mm256_set_pd(0.0, 0.0, 0.0, 0.0);
_mm256_i64scatter_pd(tmpMemoryDoubles, tmpRegisterIndex, tmpRegisterDouble, 1);
_mm256_i64scatter_pd() 的文档将参数定义为:
void _mm256_i64scatter_pd (void* base_addr, __m256i vindex, __m256d a, const int scale)
这是错误消息:
/usr/lib/gcc/x86_64-linux-gnu/7/include/avx512vlintrin.h:11152:1: error: inlining failed in call to always_inline 'void _mm256_i64scatter_pd(void*, __m256i, __m256d, int)': target specific option mismatch
_mm256_i64scatter_pd (void *__addr, __m256i __index,
src_avx2/PRE_build_region_impulse_devel_avx2.cpp:631:33: note: called from here
_mm256_i64scatter_pd(tmpMemoryDoubles, tmpRegisterIndex, tmpRegisterDouble, 1);
谁能看到我做错了什么?
解决方案
这不是 AVX2 指令。如果你用编译器编译-march=native
并且编译器给你这个,你的 CPU 没有 AVX512VL。AVX2只有集合;散点图是 AVX512 的新功能。
GCC 和 clang 需要启用 ISA 扩展才能发出这些指令,即使您使用内部函数也是如此。(与 MSVC 和 ICC 不同)。您可以编译-mavx512vl
或-march=skylake-avx512
编译成功,然后在不支持它的 CPU 上运行时出错。
这就是target specific option mismatch
意思;如果您在inlining failed in call to always_inline
和/或上搜索过target specific option mismatch
,您会发现很多关于需要-mwhatever
.
或者,如果您_mm256_i64scatter_pd
在Intel 的内在函数 finder中查找,您会发现它需要 AVX512VL。
推荐阅读
- sql - 从 Excel (ODBC) 中的查询乘以参数
- python - 如何在 QTreeWidget 中创建可编辑值
- linux - 詹金斯“sh”搞砸了gradle命令
- node.js - Azure Bot - 通过 REST API 进行通信
- haskell - 需要使用 hid 库获取 ledger nano 设备的唯一标识符
- powershell - Copy-Item 排除一个目录
- web-component - 我可以将自定义属性设置为 HTML 标记的指令,如 Angular 的指令吗?
- php - Codeigniter TCPDF - 加载多个 PDF
- ios - 如何从连接到我的 wifi 的 IP 地址或 MacAddress 获取主机名
- sql - 如何从xml中获取数据?