首页 > 解决方案 > GCC 是否有用于 AVX512 操作的内置函数?

问题描述

我期待找到类似的功能

__builtin_ia32_fmaddps512

根据手册,在最近的 GCC 中启用 512 位 AVX512 寄存器的使用方式与使用 256 位 AVX2 寄存器的方式相同,但它们在 GCC 9.2 中不存在。这只是等待的问题,还是它们不存在的一些政策原因?

标签: gccavx512gcc9

解决方案


AVX512 内置函数带一个掩码(可以是-1)。

可移植的内在函数_mm512_fmadd_ps( #include <immintrin.h>) 在 GCC9.1 的头文件中定义为:

extern __inline __m512
__attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
_mm512_fmadd_ps (__m512 __A, __m512 __B, __m512 __C)
{
  return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
                                                   (__v16sf) __B,
                                                   (__v16sf) __C,
                                                   (__mmask16) -1,
                                                   _MM_FROUND_CUR_DIRECTION);
}

我通过查看/usr/lib/gcc/x86_64-pc-linux-gnu/9.1.0/include/avx512*.h我的系统发现了这一点。(不要直接包括那些,仅来自immintrin.h

IDK 为什么您要使用__builtin_ia32_vfmaddps512_mask英特尔的内在函数之一,例如_mm512_mask_fmadd_ps(合并到第一个操作数)或_mm512_mask3_fmadd_ps(合并到+c操作数)或_mm512_maskz_fmadd_ps(零掩码)。

甚至是完整的_mm512_maskz_fmadd_round_ps,它还允许指定舍入覆盖和屏蔽。

但无论如何,这就是您如何在任何英特尔内在函数(如果有的话)下找到真正的 GCC 内置函数的名称。


推荐阅读