首页 > 解决方案 > 什么时候使用 npz 文件而不是 csv 更好?

问题描述

我正在查看一些使用 Keras 的机器学习/预测代码,输入数据集存储在 npz 文件中,而不是通常的 csv 格式。

为什么作者会使用这种格式而不是 csv?它有什么优点?

标签: pythoncsvnumpy

解决方案


这取决于预期的使用情况。如果一个文件预计有广泛的用例,包括从普通客户端机器直接访问,那么 csv 很好,因为它可以直接加载到广泛部署的 Excel 或 LibreOffice calc 中。但它只是一个很好的旧文本文件,没有索引,也没有任何附加功能。

另一方面,一个文件只希望由数据科学家或一般来说具有 numpy 意识的用户使用,那么 npz 是一个更好的选择,因为它具有附加功能(压缩、延迟加载等)。

长话短说,你用更多的观众换取更高的功能。


推荐阅读