amazon-web-services - 如何从 S3 中删除特定日期的子存储桶
问题描述
我有如下S3
路径:
s3://edl/raw-v2/LOS5DB/
现在,考虑这条路径:
s3://edl/raw-v2/LOS5DB/LOS5/ADDRESS_DETAILS/
此表有 parquet 数据,如下所示:
edl_load_ts=2020-11-10/
edl_load_ts=2020-11-19/
edl_load_ts=2020-12-10/
edl_load_ts=2020-12-11/
现在我想通过实例删除数据,该EC2
实例将删除所有具有数据的表的数据before 20th November
。
为此,我开发了一个正则表达式模式,如下所示:
aws s3 rm s3://edl/raw-v2/LOS5DB/LOS5/ --recursive --dryrun --exclude "\*/\*" --include "\*/\*=2020-11-20/
但是这个命令会删除LOS5下每个表下的所有数据。它不工作低于20th November
。我希望它删除过去日期的每个表的数据。我无法手动执行此操作,因为每个 DB 有 1000 多个表。
我哪里错了?
解决方案
推荐阅读
- xml - odoo 11如何继承和显示一些视野
- php - 如何从 mysql 数据库中选择随机行(比如 100 行中的 10 行)并用一系列数字显示它们
- angular - 通过第二个对话窗口以角度关闭第一个对话窗口
- html - 构建圆形百分比图表
- html - 如何将标签与 CSS 中 div 的“BOTTOM”对齐?
- react-native - 我如何在本机反应中设置选择器的样式
- iis - OPTIONS/200OK 之后的下一步
- pandas - 熊猫数据框添加新列并将现有列方向更改为索引
- php - 使用查询字符串重定向 URL?
- c++ - 基本的 c++ 问题:如果我在函数中创建一些东西并返回它会发生什么?