首页 > 解决方案 > Amazon Macie 读取数据库数据

问题描述

我在 Amazon Macie 做一些 POC。我从文档中得知它可以识别信用卡等 PII 数据。甚至我运行了一个示例,其中我将一些有效的信用卡号放入 CSV 并放入 S3 存储桶并由 Macie 识别。

我想知道相同的 PII 数据是否在 S3 存储桶中的某个数据库备份/转储文件下。Macie 能够识别吗?我在文档中没有找到任何东西。

标签: amazon-web-servicesamazon-s3amazon-macie

解决方案


所以这里有几件事很重要

Macie 只能处理某些类型的文件和某些压缩格式

如果您指定的 S3 存储桶包含 Macie 不支持的格式的文件,Macie 不会对它们进行分类。

压缩格式 https://docs.aws.amazon.com/macie/latest/userguide/macie-compression-archive-formats.html

加密对象 Macie 只能处理某些类型的加密 Amazon S3 对象有关更多详细信息,请参阅以下链接: https ://docs.aws.amazon.com/macie/latest/userguide/macie-integration.html#macie-encrypted-objects

梅西限制

Macie 对可在帐户中分类的数据量有默认限制。达到此数据限制后,Macie 将停止对数据进行分类。默认数据分类限制为 3 TB。如果需要,可以增加此值。

Macie 的内容分类引擎最多可处理 S3 对象的前 20 MB。

因此,特别是如果您的转储是压缩的,但在压缩中采用合适的格式,那么 Macie 可以分类,但重要的是,它只会分类文件的前 20 MB,如果文件很大,这是一个问题。

通常我使用 lambda 将一个大文件拆分为不到 20 MB 的文件。如果您有 X 个文件,您仍然需要考虑如何从已分类为 PII 的文件中获取记录并将其映射回可用的内容。


推荐阅读