首页 > 解决方案 > “nvstrings”对象没有属性“to_gpu_array”

问题描述

我正在使用 cuML 进行随机梯度下降。我使用 sklearn 的 train_test_split 从 cuDF 数据帧生成 train_X、train_y ... 的拆分。

以下代码(我删除了与此问题无关的超参数):

from cuml.solvers import SGD as cumlSGD
cu_sgd = cumlSGD(eta0=0.005)
cu_sgd.fit(train_X, train_y)

在 cu_sgd.fit 行上引发以下错误:“nvstrings”对象没有属性“to_gpu_array”

我该如何解决这个问题?

标签: rapidscudf

解决方案


解决方案是首先将任何列转换为train_Xtrain_Y具有string dtypeto categorydtype 的列。字符串不能转换,to_gpu_array因为它们不是固定宽度的。您将丢失实际的字符串值,但可以重建它们,并且cu_sgd.fit应该可以正常工作。


推荐阅读