首页 > 解决方案 > 如何使用 colab 读取 30GB 大的 tar.xz

问题描述

我使用 Google Colab 下载了一个 30GB 的 tar.xz 文件到我的 G 盘。在 Colab 中提取和阅读此文件夹时,我需要帮助。在 tar 文件夹内,有十个文件夹。是否可以单独读取这些文件夹?我尝试了以下方法,但失败了。

  1. 解压 G-Drive 中的 30GB 文件夹,但由于在 G-Drive 中读写文件的限制而失败。
  2. 我可以直接将文件下载到本地 Colab 目录,但是由于 Colab 的空间限制,我无法在本地目录中提取或读取它。

有关如何处理此问题的任何建议。谢谢

标签: python-3.xgoogle-colaboratory

解决方案


--wildcards您可以使用选项仅提取 tar 文件中的目录。

!tar xf file.tar.xz --wildcards 'path_to/dir/*'

这是一个示例笔记本


推荐阅读