首页 > 解决方案 > 如何修复“Cudafy 在 CUDA 上出现错误 719”

问题描述

[Cudafy]
        private static void LevenshteinGpu3(GThread thread, char[] source, char[] pattern, int firstDim, byte compareLength, byte[] dev_results)
        {
            int tid = thread.threadIdx.x + thread.blockIdx.x * thread.blockDim.x;
            byte[,,] dev_levMatrix_1 = _gpu.Allocate<byte>(20, 20, 20);
            for (byte j = 0; j <= compareLength; j++)
            {
                dev_levMatrix_1[tid, 0, j] = j;
                dev_levMatrix_1[tid, j, 0] = j;
            }

            if (tid < firstDim)
            {
                for (int i = 1; i <= compareLength; i++)
                {
                    for (int j = 1; j <= compareLength; j++)
                    {
                        int iMinusOne = i - 1;
                        int jMinusOne = j - 1;

                        if (tid + iMinusOne < source.Length && source[tid + iMinusOne] == pattern[jMinusOne])
                        {
                            dev_levMatrix_1[tid, i, j] = dev_levMatrix_1[tid, iMinusOne, jMinusOne];
                        }
                        else
                        {
                            byte x = dev_levMatrix_1[tid, iMinusOne, j];
                            if (x > dev_levMatrix_1[tid, i, jMinusOne])
                                x = dev_levMatrix_1[tid, i, jMinusOne];
                            if (x > dev_levMatrix_1[tid, iMinusOne, jMinusOne])
                                x = dev_levMatrix_1[tid, iMinusOne, jMinusOne];
                            dev_levMatrix_1[tid, i, j] = ++x;
                        }
                    }
                }
                dev_results[tid] = dev_levMatrix_1[tid, compareLength, compareLength];
            }
        }

我在 github 上使用 Konrad-Ziarko 的代码。但是当我把

byte[,,] dev_levMatrix_1 = _gpu.Allocate<byte>(20, 20, 20); 

在代码中并运行。Cuda 显示错误 719。

但如果我dev_levMatrix_1 像下面这样,它的工作原理:

private static void LevenshteinGpu3(GThread thread, char[] source, char[] pattern, dev_levMatrix_1, int firstDim, byte compareLength, byte[] dev_results)

我可以dev_levMatrix_1输入一个函数吗?

标签: c#cudafy.net

解决方案


有点晚了,但是...

您不能在 Cudafy 装饰函数中分配 GPU 内存。分配应该在将参数传递给内核之前发生。在内核函数内部,您可以创建局部变量并使用它们。

此外,您可以更快地在源而不是其他地方提出问题并提及源。


推荐阅读