首页 > 解决方案 > hadd 的 AVX2 内在函数替换

问题描述

我正在使用 C++ AVX2 内在函数来水平累加值。

我有一个包含 3 个值的向量 (_m256i)。我可以使用 2 个 _mm256_hadd_epi32 函数将它们添加在一起,但是我要求我找到一种不使用它的水平添加方法。

我的想法是如何将它们分成 3 个向量,每个向量包含 1 个值,然后 _mm256_add_epi32 它们。

关于使用什么功能的任何建议?

目的是提高效率。我真的很感激所有的建议!谢谢你

标签: c++intrinsicsavx2

解决方案


推荐阅读