首页 > 解决方案 > OpenCL 中是否存在与 native_recip() 等效的 CUDA?

问题描述

OpenCL 有一个名为的内置函数native_recip

gentype native_recip(gentype x);

native_recip在实现定义的范围内计算倒数。最大错误是实现定义的。

数学函数的向量版本按分量操作。描述是针对每个组件的。

内置数学函数不受调用环境中流行的舍入模式的影响,并且始终返回与使用舍入到最接近的偶数舍入模式调用时相同的值。

CUDA中是否有与此功能等效的功能?

标签: cudaopenclporting

解决方案


正如评论中所指出的,它__frcp_rn()适用于float's 和__drcp_rn()for double's; 以及矢量类型(例如float4)的实现,以便逐元素应用 frcp/drcp。

注意:“rcp”是“reciprocal”的缩写,“rn”是舍入模式“round to最接近的偶数”


推荐阅读