python - 使用 ctypes 调用带有指针参数的 C++ 函数
问题描述
一些背景(可能与问题没有直接关系):我需要执行一个已知稀疏度的有效矩阵乘法。
因为它是稀疏的,所以使用普通矩阵乘法是浪费的,而且因为它是已知的稀疏性,我可以以一种有效的方式实现它,而不是使用稀疏库。
我已经用 C++ 实现了我的功能
void SparsePrecisionMult(double *Q, double *X, double *out, const int dim, const int markov, const int n);
这是“包装”:
import ctypes
_SPMlib = ctypes.CDLL('./SparsePrecisionMult.so')
_SPMlib.SparsePrecisionMult.argtypes = (ctypes.POINTER(ctypes.c_double), ctypes.POINTER(ctypes.c_double), ctypes.POINTER(ctypes.c_double),
ctypes.c_int, ctypes.c_int, ctypes.c_int)
def sparse_precision_mult(Q, X, out, markov_blanket_size):
global _SPM
m, d = X.shape
_SPMlib.SparsePrecisionMult(Q.ctypes.data_as(ctypes.POINTER(ctypes.c_double)),
X.T.ctypes.data_as(ctypes.POINTER(ctypes.c_double)),
out.ctypes.data_as(ctypes.POINTER(ctypes.c_double)),
d, markov_blanket_size, m)
这就是我所说的:
patch_size = 3
markov_blanket = 3
C = np.eye(9)
X = np.array(range(0, 27, 1)).reshape(3, 9)
out = np.zeros([3, 9])
sparse_precision_mult(C.astype(np.float64), X.astype(np.float64), out.astype(np.float64), 3)
print(out)
此测试应导致 out=X。
用 C 编写的这个测试的一个版本表现良好。
我出去=零。所以我的猜测是,不知何故,内存没有被共享和被复制。
我不想在我的 RAM 上重复数据(此函数将用于高维矩阵)。那么我该如何解决呢?
谢谢。
解决方案
astype
创建一个数组的副本。因此,该out.astype(np.float64)
参数给出了一个副本,sparse_precision_mult
该副本被修改然后丢弃。原件out
未修改。
out
使用类型创建np.float64
并(如有必要)在函数调用后进行转换。
如果可能,您应该创建具有函数调用所需类型的所有参数,以避免复制astype
.
astype
有一个参数copy
可以设置为False
避免不必要的副本,但最好确保副本是/不需要而不是依赖它。
推荐阅读
- vmware - 从 VMDK 文件创建虚拟磁盘映像
- shacl - 澄清 Shacl sh:qualifiedValueShape
- javascript - TypeError: Object(...) is not a function reactjs 错误
- vue.js - 使用 Jest 在 Vue 中为组件中的方法编写单元测试
- android - 删除下拉项的顶部和底部背景颜色
- variables - sed 捕获所有内容,直到使用变量作为字符串的模式
- javascript - 单击“选择我”时如何选择表格的一列?
- protocol-buffers - 为map<字符串写protobuf,重复map
> - amazon-web-services - 弹性豆茎环境健康处于警告状态
- magento - Magento 管理员未登录