首页 > 解决方案 > 使用 ctypes 调用带有指针参数的 C++ 函数

问题描述

一些背景(可能与问题没有直接关系):我需要执行一个已知稀疏度的有效矩阵乘法。
因为它是稀疏的,所以使用普通矩阵乘法是浪费的,而且因为它是已知的稀疏性,我可以以一种有效的方式实现它,而不是使用稀疏库。

我已经用 C++ 实现了我的功能

void SparsePrecisionMult(double *Q, double *X, double *out, const int dim, const int markov, const int n);

这是“包装”:

import ctypes
_SPMlib = ctypes.CDLL('./SparsePrecisionMult.so')
_SPMlib.SparsePrecisionMult.argtypes = (ctypes.POINTER(ctypes.c_double), ctypes.POINTER(ctypes.c_double), ctypes.POINTER(ctypes.c_double),
                                        ctypes.c_int, ctypes.c_int, ctypes.c_int)

def sparse_precision_mult(Q, X, out, markov_blanket_size):
    global _SPM
    m, d = X.shape
    _SPMlib.SparsePrecisionMult(Q.ctypes.data_as(ctypes.POINTER(ctypes.c_double)),
                                X.T.ctypes.data_as(ctypes.POINTER(ctypes.c_double)),
                                out.ctypes.data_as(ctypes.POINTER(ctypes.c_double)),
                                d, markov_blanket_size, m)

这就是我所说的:

patch_size = 3
markov_blanket = 3

C = np.eye(9)
X = np.array(range(0, 27, 1)).reshape(3, 9)

out = np.zeros([3, 9])

sparse_precision_mult(C.astype(np.float64), X.astype(np.float64), out.astype(np.float64), 3)

print(out)

此测试应导致 out=X。
用 C 编写的这个测试的一个版本表现良好。
我出去=零。所以我的猜测是,不知何故,内存没有被共享和被复制。
我不想在我的 RAM 上重复数据(此函数将用于高维矩阵)。那么我该如何解决呢?

谢谢。

标签: pythonc++numpyctypes

解决方案


astype创建一个数组的副本。因此,该out.astype(np.float64)参数给出了一个副本,sparse_precision_mult该副本被修改然后丢弃。原件out未修改。

out使用类型创建np.float64并(如有必要)在函数调用后进行转换。

如果可能,您应该创建具有函数调用所需类型的所有参数,以避免复制astype.

astype有一个参数copy可以设置为False避免不必要的副本,但最好确保副本是/不需要而不是依赖它。


推荐阅读