首页 > 解决方案 > 以 2 种不同方式从数组中获取 pd.DataFrame

问题描述

我开始使用机器学习,所以我尝试了 kaggle 的 MINST。我真的很好奇事情是如何运作的,因为我在网上找不到答案,我认为在这里发表我的第一篇文章是个好主意。

我在 keras 上用 CNN 做了一个简单的模型。这将是谷歌 colab 输出的预测。

Ynew =model.predict_classes(test_data)
Ynew.shape

(28000,)

Ynew

数组([2, 0, 9, ..., 3, 9, 2])

现在我尝试从中制作一个DataFrame,但我真的不明白为什么我可以用一种方式而不是另一种方式来制作它。

这个工作正常,我得到一张 28000x2 的桌子:

labels = ["ImageId","Label"]
col= list(range(1,28001))
submission=pd.DataFrame({"ImageId":col,"Label":Ynew})

但在这一行上,我把所有东西都挤在只有 1 行:

submission2=pd.DataFrame(data=[[col,Ynew]],columns=labels)

两种方式不应该一样吗?希望帖子不是那么糟糕,谢谢!

标签: pythonpandasdataframekaggle

解决方案


submission2=pd.DataFrame(data=Ynew, index=col, columns=labels)

推荐阅读