首页 > 解决方案 > 关于 pycuda._driver.LogicError: cuMemcpyDtoH failed: invalid argument 的问题

问题描述

我试图运行基于以下链接的代码

https://documen.tician.de/pycuda/tutorial.html

在这个链接中运行代码结果很好。

这是我的具有类似定义的版本。请注意,我是在引擎上下文中运行的,因为我想运行一个 engine.execute 函数。

import pycuda.driver as cuda 
import pycuda.autoinit 
import tensorrt as trt 

import numpy as np
from keras.datasets import mnist 

dims = (1, 28, 28) 
dims2 = (1, 1, 10) 
batch_size = 1000 

nbytes = batch_size * trt.volume(dims) * np.dtype(np.float32).itemsize 
nbytes2 = batch_size * trt.volume(dims2) * np.dtype(np.float32).itemsize 

self.d_src  = cuda.mem_alloc(nbytes) 
self.d_dst = cuda.mem_alloc(nbytes2) 

bindings = [int(self.d_src), int(self.d_dst)] 

(x_train, y_train), (x_test, y_test) = mnist.load_data()

img_h = x_test.shape[1]
img_w = x_test.shape[2]

x_test = x_test.reshape(x_test.shape[0], 1, img_h, img_w)

x_test = x_test.astype('float32')
x_test /= 255
num_test = x_test.shape[0]

output_size = batch_size * trt.volume(dims2)

y = np.empty((num_test,output_size), np.float32)

for i in range(0, num_test, batch_size): 
     x_part = x_test[i : i + batch_size] 
     y_part = y[i : i + batch_size] 
     cuda.memcpy_htod(self.d_src, x_part) 

     cuda.memcpy_dtoh(y_part, self.d_dst) 

然而它在 memcpydtoh 上失败了,但 memcpyhtod 工作。

File "a.py", line 164, in infer
    cuda.memcpy_dtoh(y_part, self.d_dst)
pycuda._driver.LogicError: cuMemcpyDtoH failed: invalid argument

为什么会这样?定义类似于链接中的代码。

标签: pythonpython-3.xpycudatensorrt

解决方案


反正我已经解决了。

设备分配需要不同x_party_part因为它们的大小不同。

因此,如果我定义output_size = trt.volume(dims2).

错误消息一开始并不是很有帮助,让我觉得我输入了错误的参数。


推荐阅读