python-3.x - 在 fastai 库中使用 download_data() 和 untar_data()
问题描述
我使用 fastai 库中的 dowload_data() 函数从 kaggle 下载了 Fashion MNIST 数据集。
downloaded_data = download_data("https://www.kaggle.com/zalando-research/fashionmnist/download")
输出 -
PosixPath('/root/.fastai/data/download.tgz')
download_data 将其保存为 .tgz 文件,现在我使用 untar_data()。
path = untar_data('/root/.fastai/data/download.tgz')
输出 -
PosixPath('/root/.fastai/data/download.tgz')
哪个没有提取 .tgz 文件。如何在 fastai 库中使用此数据集?
解决方案
在 fastai 库中,download_data 为您提供了一个pathlib.PosixPath
文件,而不是确切的文件,您需要使用另一个解压缩库来提取数据。
如果你只需要来自 fast ai 的 MNIST 数据,这里有一个更简单的方法:
from fastai import datasets
import gzip, pickle
MNIST_URL='http://deeplearning.net/data/mnist/mnist.pkl'
path = datasets.download_data(MNIST_URL, ext='.gz')
with gzip.open(path, 'rb') as f:
((x_train, y_train), (x_valid, y_valid), _) = pickle.load(f, encoding='latin-1')
推荐阅读
- html - 图像背景不适合屏幕
- java - Java 8:递归流图
- postgresql - 将 PostgreSQL 数据目录移动到 3.1 USB 闪存驱动器上的新位置
- pandas - 按天分组,汇总相同的产品编号,然后按周分组,按产品编号汇总产品,然后按周分组并汇总所有产品
- laravel - laravel vue 产品内分类
- windows - 当从 Windows 计划任务中作为 SYSTEM 执行时,什么可能会阻止 PHP 作曲家工作?
- mysql - 什么Mysql使用大量CPU
- javascript - 淡出香草JavaScript后删除项目
- google-apps-script - 谷歌脚本复制/粘贴/清除删除粘贴的单元格
- java - Android 应用程序无法写入下载目录:java.io.FileNotFoundException(权限被拒绝)