python - 如何在 google-colab 中使用 Librispeech 360h 数据集?
问题描述
我正在使用 Google colab(启用 GPU)来训练我的 ASR 模型。使用 train-clean-100 Librispeech 数据集的模型的准确性不是很好,所以我决定使用以下方式下载train-clean-360 数据集:torchaudio.datasets.LIBRISPEECH("./data", url='train-clean-360', download=True)
但我无法下载它,因为 google-colab 中可用的磁盘存储空间为 36GB
我尝试在我的 google-drive 帐户中上传和解压缩train-clean-360 数据集并将其挂载到 google-colab,这样我就可以使用该数据集而无需通过以下代码下载它:
torchaudio.datasets.LIBRISPEECH("/content/gdrive/My Drive/", url="train-clean-360", folder_in_archive="LibriSpeech", download=False)
但它不起作用。
难道我做错了什么?有没有其他方法可以在 google-colab 中使用这个数据集?
解决方案
推荐阅读
- javascript - 对具有相同类的多个元素使用 getBoundingClientRect()?
- tomcat8 - 我在tomcat启动中注意到ClassFormatException下面
- sql - 我无法添加外键:被引用的表中没有与外键中的引用列列表匹配的主键或候选键
- javascript - 当系列名称没有归属于它的值时隐藏类别 highchart
- sql - 如何使用 SQL 组过滤具有最小日期值的行?
- twitter-bootstrap - Bootstrap:结合使用 scrollspy 和sticky-top
- javascript - 使用 python 脚本将 Pcap 文件转换为文本
- flutter - 有人知道如何在 Flutter 中实现时间线图或事件图吗?
- java - Java Swing中带有JLabel的超链接
- java - 如何防止我的用户在一定时间内做某事