python - 以 2 种不同方式从数组中获取 pd.DataFrame
问题描述
我开始使用机器学习,所以我尝试了 kaggle 的 MINST。我真的很好奇事情是如何运作的,因为我在网上找不到答案,我认为在这里发表我的第一篇文章是个好主意。
我在 keras 上用 CNN 做了一个简单的模型。这将是谷歌 colab 输出的预测。
Ynew =model.predict_classes(test_data)
Ynew.shape
(28000,)
Ynew
数组([2, 0, 9, ..., 3, 9, 2])
现在我尝试从中制作一个DataFrame,但我真的不明白为什么我可以用一种方式而不是另一种方式来制作它。
这个工作正常,我得到一张 28000x2 的桌子:
labels = ["ImageId","Label"]
col= list(range(1,28001))
submission=pd.DataFrame({"ImageId":col,"Label":Ynew})
但在这一行上,我把所有东西都挤在只有 1 行:
submission2=pd.DataFrame(data=[[col,Ynew]],columns=labels)
两种方式不应该一样吗?希望帖子不是那么糟糕,谢谢!
解决方案
submission2=pd.DataFrame(data=Ynew, index=col, columns=labels)
推荐阅读
- box-api - 我如何在 Box 中签署文档,我对电子签名感兴趣?
- phpunit - 我得到了未定义的索引:livewire 测试中的指纹
- python - Python对熊猫数据框中列表中的元素进行排序
- c - 全局定义的变量作为函数返回
- javascript - Onclick 事件创建具有锁定大小的元素
- forms - 使用 Adobe ColdFusion 将下拉列表中的选定选项传递到变量中
- python - Dask 警告提供明确的输出类型
- amazon-web-services - 创建/删除 s3 存储桶(对象)时,有什么方法可以发送警报吗?
- python - Pandas 读取 csv,列名分布在多行中
- javascript - 如何在js中显示来自json的对象