google-cloud-platform - 将数据导入 GCP 中的本地 SSD 卷
问题描述
我正在设置一个实例(在谷歌云平台上)100GB boot disk
和一个local SSD
. 我的数据大致是150GB
. 导入此数据时,出现内存不足错误。当我将启动磁盘大小增加到200GB
时,没有错误。
我认为数据被写入引导磁盘而不是local SSD
. 我如何确保它是local SSD
存储数据的,而不是存储数据的boot disk
?
[编辑] 我正在使用lsblk安装 ssd不清楚 [MNT_DIR] 应该在什么
sudo mkdir -p /mnt/disks/[MNT_DIR]
我的数据被导入到/home/jupyter/
解决方案
当您使用本地 SSD 创建实例时,磁盘本身尚未挂载,您需要在其上创建文件系统并挂载它(在 linux 中,您可以通过运行来查看挂载的磁盘lsblk
)。
https://cloud.google.com/compute/docs/disks/local-ssd#formatindividual
本文档说明了如何挂载单个本地 SSD,以及如果您想挂载多个本地 SSD,如何创建 RAID 阵列。
从评论 -
是的,您应该将数据导入您已安装磁盘的文件夹中,但恕我直言,我不会为此使用 home,我认为最好将所有外部磁盘安装到“/mnt”(所以“/mnt/vol "、"/mnt/vol1" 或类似的东西)。如果您将使用 /home,您将“隐藏”此目录中存在的当前文件。
推荐阅读
- wolfram-mathematica - 求解 6 个不工作的变量的 6 个非线性方程
- python - python - 如何定义一个创建与python相互嵌入的for循环的函数?
- python - 如何使用从 cvxopt.solvers 获得的参数绘制非线性决策边界?
- perl - Perl 在第二个元素后加入数组
- python - 用于查找子字符串的正则表达式
- angular - Angular 无法使用可观察的服务调用方法
- python - ttk Progressbar 使用 grid vs pack 的问题
- r - 在 R 中使用 sapply 函数时,如何维护小标题的名称列表?
- postgresql - 在文本上选择奇怪的字符,不使用 LIKE 运算符
- sql - 在 influx 中使用 distinct with groupby 和 where 子句