google-cloud-platform - 编辑 GCP 存储桶中的多个文件
问题描述
我需要导出到 BigQuery 的 GCS 存储桶中有多个 JSON 文件。
它们不是换行符分隔的我需要编辑文件,并且我希望使用云外壳来大规模执行此操作,因为这样的数据转储会经常发生。
我在想它应该是类似的东西
gsutil cat gs://triad_data/file_testing/Appointment.json | jq -c '.[]' > apptNDJSON.json
但我不知道如何为我的存储桶中的所有物品输送这个。这是正确的思路还是在 GCP 中不可能进行这样的操作?
解决方案
云存储不是文件系统。您只能写入、删除和读取。没有更新,没有动静。您可以激活版本控制以创建新版本,但不能直接更新 GCS 上的现有 blob。
在 GCS 上,特别是使用 gsutil,命令“gsutil cat”用于将对象内容连接到标准输出,换句话说,在控制台上显示文件的内容。
与您要查找的内容更相似的命令是“gsutil compose”,但这会将 File_A 和 File_B 的内容连接到一个新的 File_C 中,这不是您要查找的内容。
您需要对应用程序进行编码以下载文件编辑内容然后再次上传文件或类似的东西
推荐阅读
- angular - Angular 9:调用 API 来检查会话是否未过期的 Guard
- javascript - 停止 Div 调整 bur 的大小仍然使用百分比(不使用 Javascript)
- python - 将随机点放在正方形区域中,同时保持最小距离(Python)
- javascript - 使用 Discord.js 检测到添加的特定角色时删除另一个角色
- create-react-app - Create-react-app 不会为 yalc 更新热重载
- azure - 无法转换为类型'system.collections.generic.IList
' - cookies - `ctx.cookies` 在 apollo-server-koa 中始终未定义
- jquery - 复制时在文章中间添加一个 URL
- python - DRF POST 给出 NOT NULL 约束失败
- python - 可以使用一个 AWS 存储桶,但不能使用另一个