amazon-web-services - 使用 s3 路径的子字符串进行分区
问题描述
我们有一个 s3 存储桶,其中包含以下格式的文件:
6ugdasznp56o_2020-09-04T140000_6081c358e0417bdd81284b0cf7a6b321_2853a9.csv.gz
是否可以定义storage.location.template
如下:
6ugdasznp56o_${year}-${month}-${date}T${hour}0000_6081c358e0417bdd81284b0cf7a6b321_2853a9.csv.gz
在这个 s3 存储桶中对我的文件进行分区?
解决方案
分区不能发生在文件级别,而只能发生在文件夹结构上,另请参阅Amazon S3 中的表位置:
请勿使用以下任何项目
LOCATION
为您的数据指定 。
- 不要使用文件名、下划线、通配符或 glob 模式来指定文件位置。
不起作用的例子:
...
s3://path_to_bucket/mySpecialFile.dat
s3://bucketname/prefix/filename.csv
...
推荐阅读
- mysql - 不同列数的多个表的并集,由另一个表排序以获取更改的列名
- bash - 将我的 Mac OS 更新到 Catalina 后,Flutter 在 Android Studio 中不再工作。我删除并重新安装,但仍然无法正常工作
- java - Jmeter - 将文件从一台主机复制到另一台主机
- c# - c#中字符串的奇怪IndexOf返回-1
- azure - 在 Linux 上使用 blob fuse 挂载 Azure blob 存储时,挂载大小为 7.8GB,如何将初始挂载大小增加到 2 TB
- r - 在两个日期之间的 R 数据框中生成记录
- python - Python sklearn ValueError:数组太大
- javascript - 无法为莫里斯图绘制垂直事件线
- java - 如何分隔二维数组中的不同值
- xpath - 来自网站的 Google 表格 IMPORTXML 文本字段