cuda - OpenCL 中是否存在与 native_recip() 等效的 CUDA?
问题描述
OpenCL 有一个名为的内置函数native_recip
:
gentype native_recip(gentype x);
native_recip
在实现定义的范围内计算倒数。最大错误是实现定义的。数学函数的向量版本按分量操作。描述是针对每个组件的。
内置数学函数不受调用环境中流行的舍入模式的影响,并且始终返回与使用舍入到最接近的偶数舍入模式调用时相同的值。
CUDA中是否有与此功能等效的功能?
解决方案
正如评论中所指出的,它__frcp_rn()
适用于float
's 和__drcp_rn()
for double
's; 以及矢量类型(例如float4
)的实现,以便逐元素应用 frcp/drcp。
注意:“rcp”是“reciprocal”的缩写,“rn”是舍入模式“round to最接近的偶数”。
推荐阅读
- reactjs - 使用 React 构建 CRM Web 资源
- apache - 如何在 Xampp 上为 Laravel 5.8 启用虚拟主机
- c++ - 在 C++ 中更改对象的动态类型
- javascript - 如何修复此代码 - 不显示任何输出
- python - 当尝试运行脚本来测试是否安装了 tensorflow 时,我收到了一个我不明白的大错误
- node.js - Mongoose 插入许多堆内存不足
- javascript - 如何从秒表中节省时间并在另一个 html 页面中显示该时间
- html - 如何对已创建的多个按钮实现翻转功能?
- c# - 如何创建属性来检查用户是否对 Identity core 2.2 有声明?
- callback - 在 JINT 中使用委托处理 Javascript 回调