首页 > 解决方案 > 在 Windows 8.1 中使用 curl 下载 YouTube-8M 数据集时出错

问题描述

我正在尝试下载一小部分 YouTube-8M 数据集。它只是一个包含视频特征和标签的数据集,您可以创建自己的模型来对它们进行分类。

他们声称将下载数据集的命令是这样的:

curl storage.googleapis.com/data.yt8m.org/download_fix.py | shard=1,100 partition=2/frame/train mirror=us python

这实际上根本不起作用,产生的错误是:

'shard' is not recognized as an internal or external command,operable program or bash file.

我发现有人在论坛上发帖。它说要向似乎部分解决我的问题的变量添加“设置”。

curl storage.googleapis.com/data.yt8m.org/download_fix.py | set shard=1,100 partition=2/video/train mirror=us python

下载似乎开始了一瞬间并弹出错误。现在的错误是(23) Failed writing body

在此处输入图像描述

那么下载数据集的命令行是什么。

标签: youtubedeep-learningkaggle

解决方案


我会尝试使用 Kaggle API。您可以使用以下方式安装 API:

pip install Kaggle

然后下载您的凭据(此处的分步指南)。最后,您可以像这样下载数据集:

kaggle competitions download -c youtube8m

如果只想要部分数据集,可以先列出所有可下载的文件:

kaggle competitions files -c youtube8m

然后只下载你想要的文件:

kaggle competitions download -c youtube8m -f name_of_your_file.extension

希望有帮助!:)


推荐阅读