c++ - hadd 的 AVX2 内在函数替换
问题描述
我正在使用 C++ AVX2 内在函数来水平累加值。
我有一个包含 3 个值的向量 (_m256i)。我可以使用 2 个 _mm256_hadd_epi32 函数将它们添加在一起,但是我要求我找到一种不使用它的水平添加方法。
我的想法是如何将它们分成 3 个向量,每个向量包含 1 个值,然后 _mm256_add_epi32 它们。
关于使用什么功能的任何建议?
目的是提高效率。我真的很感激所有的建议!谢谢你
解决方案
推荐阅读
- apache-spark-2.0 - 如何在使用scala从文件夹中读取所有json文件时应用过滤器?
- python - 错误:未找到请求的 URL/对话
- python - 在 linux ec2 上安装 Anaconda 3 后,从 linux 卸载一个 Anaconda version2
- listview - 没有孩子的stackPane JavaFX上的鼠标事件
- ios - UIApplication keyWindow 行为已更改
- r - 如何使用 Shiny 应用程序创建调查表
- ios - iOS 通用链接在不打开 Safari 的情况下重定向到 App Store
- javascript - 如何在 HTML 中搜索多个表格?
- php - 如何访问laravel中数组内的集合内的属性
- apache-spark - 星火投射默认值