首页 > 解决方案 > 按日期过滤 s3 中的对象,而不是最后一次修改

问题描述

Redshift 以以下结构存储审计日志:

Amazon Redshift 审计日志记录的存储桶结构 默认情况下,Amazon Redshift 使用以下存储桶和对象结构组织 Amazon S3 存储桶中的日志文件:AWSLogs/AccountID/ServiceName/Region/Year/Month/Day/AccountID_ServiceName_Region_ClusterName_LogType_Timestamp.gz

例如:AWSLogs/123456789012/redshift/us-east-1/2013/10/29/123456789012_redshift_us-east-1_mycluster_userlog_2013-10-29T18:01.gz

如果我想过滤这些对象并且只检索两个日期之间的对象......我必须遍历日期范围之间的日期,将日期作为字符串,然后使用对象的文件名进行正则表达式匹配或字符串匹配,对吗?我不想使用last_modified日期。这是唯一的方法对吗?

顺便说一句,这个对象路径是什么?我可以将其视为文件夹吗?它们真的是文件夹还是只是对象名称的一部分?

标签: amazon-web-servicesamazon-s3

解决方案


推荐阅读