首页 > 解决方案 > 英特尔编译器内在函数

问题描述

我决定试用英特尔编译器的试用版。现在我想了解是否存在需要显式使用内在函数来提高代码性能的情况。

当编译器在幕后完成所有工作时,自动矢量化(或者,我应该说,编译器如何利用其 SSE 和 AVX 寄存器的方式)似乎工作正常。

请你给我看一个相反的例子吗?可能是一些涉及 OpenMP 的案例?你怎么看?

标签: vectorizationcompiler-optimizationsseintrinsicsicc

解决方案


看看这张幻灯片,你就会知道答案。

https://users.ece.cmu.edu/~franzf/teaching/slides-18-645-simd.pdf


推荐阅读