c - 在 OpenCL 中计算单个位?
问题描述
我必须使用 OpenCL 实现一个算法,我已经给出了一些数字来计算每个数字从某个偏移量连续形成的后续零的数量。这是代码:
int count=0;
for(int i=63-offset; i>=0; i--)
{
long long int count_pow_1 = 1;
long long int base = 2;
long long int exp = i;
for(int j=exp; j>=0; j--){
if(j==0) {break;}
if(j==1) {count_pow_1 = count_pow_1 * base; break;}
count_pow_1 = count_pow_1 * base;
}
unsigned long long int count_pow = count_pow_1;
if(((bits/(count_pow))%2)==1){
break;
}else{
count++;
}
}
其中 count 是后面的零的数量。但它不起作用,它给了我一个接近 56 的数字,偏移量为 8,这意味着这些数字被视为全零或几乎全零。你看到问题出在哪里了吗?不使用 opencl 在 CPU 上执行代码似乎可以正常工作。
解决方案
您可以更快、更优雅地做到这一点:要从偏移量中获取后续零的数量,首先将数字向左移动偏移量 ( bits = bits<<offset;
),然后计算前导零的数量。
要计算前导零的数量,您可以使用内置的 OpenCL 函数int count = clz(bits);
,请参阅OpenCL 1.2 参考卡。或者,您可以利用该强制转换来隐含地为指数执行 log2,这相当于以位为单位的数字的长度减去 1 减去前导零的数量:int count = 63-(int)((as_ulong((double)bits)>>52)-1023);
。clz
执行非常缓慢,因此施法技巧运行得更快。
推荐阅读
- javascript - sh: lerna: 使用 docker 运行应用程序时未找到
- python - 退出状态为 128 的子进程调用
- r - na.fail.default 中的错误:对象中缺少值
- java - 如何使用 Iterator 类从 List 中删除重复元素?
- tensorflow - “仅整数、切片 (`:`)、省略号 (`...`)、tf.newaxis (`None`) 和标量”出错
- kotlin - 如何使用 Spock (groovy) 测试 kotlin 挂起功能
- javascript - 新的 Firefox 70 不能正确打开大部分页面。其中大多数显示 JavaScript 错误“NS_ERROR_FILE_NOT_FOUND”
- reactjs - webpack devServer如何在浏览器中接受除root/之外的其他路径?
- spring-boot - 如何使用 JpaRepository 提取大数据
- asp.net-core - 设置 EmailSettingNames.Smtp.EnableSsl 会导致“字符串未被识别为有效的布尔值”错误