首页 > 解决方案 > np.concatenate 错误...ValueError:所有输入数组必须具有相同的维数

问题描述

在我尝试将标题加载到数据框之前,我的代码字很好。这似乎是 np.concatenate 的问题。

我尝试转置数组以查看它是否方向不正确。

print("\n")
print("Prediction")

Y = vectorizer.transform(df['plot_keywords'].astype('U'))

prediction = model.predict(Y)

df_tmp = np.concatenate([df, pd.DataFrame(np.transpose(prediction.astype(np.int32)), columns=['cluster_plot_keywords'])], axis=1)


#!!!this is where the error is, caused by the np.concatenate!!!
df = pd.DataFrame(df_tmp, columns=[np.concatenate([df.columns.values,'cluster_plot_keywords'])])

预期的结果是我可以编写 df 并打印数据框。

在为数据框创建标头时收到以下错误:

ValueError    Traceback (most recent call last)
<ipython-input-12-42a155bf519f> in <module>
      7 
      8 #!!!this is where the error is, caused by the np.concatenate!!!
----> 9 df = pd.DataFrame(df_tmp, columns=[np.concatenate([df.columns.values,'cluster_plot_keywords'])])

ValueError: all the input arrays must have same number of dimensions

如果我打印 df_tmp,它会正确输出数组,但不会作为数据框输出,这就是我尝试在列中加载的原因:

array([['Color', 'James Cameron', 723.0, ..., 1.78, 33000, 0],
       ['Color', 'Gore Verbinski', 302.0, ..., 2.35, 0, 0],
       ['Color', 'Sam Mendes', 602.0, ..., 2.35, 85000, 0],
       ...,
       ['Color', 'Benjamin Roberds', 13.0, ..., nan, 16, 2],
       ['Color', 'Daniel Hsia', 14.0, ..., 2.35, 660, 2],
       ['Color', 'Jon Gunn', 43.0, ..., 1.85, 456, 1]], dtype=object)

标签: pythonnumpydataframe

解决方案


np.concatenate([df.columns.values,'cluster_plot_keywords'])

您正在尝试将一个类似数组的对象 ( df.columns.values) 与一个字符串连接起来,'cluster_plot_keywords'(它被“解释”为 0 维数组)。这似乎是一个错字;也许你的意思是

np.concatenate([df.columns.values, prediction['cluster_plot_keywords']])

或者

np.concatenate([df.columns.values, df['cluster_plot_keywords']])

?

但是如果不知道更多关于究竟'cluster_plot_keywords'是什么(以及dfprediction以及它们各自的内容),我无法确定。


推荐阅读