amazon-web-services - Amazon Macie 读取数据库数据
问题描述
我在 Amazon Macie 做一些 POC。我从文档中得知它可以识别信用卡等 PII 数据。甚至我运行了一个示例,其中我将一些有效的信用卡号放入 CSV 并放入 S3 存储桶并由 Macie 识别。
我想知道相同的 PII 数据是否在 S3 存储桶中的某个数据库备份/转储文件下。Macie 能够识别吗?我在文档中没有找到任何东西。
解决方案
所以这里有几件事很重要
Macie 只能处理某些类型的文件和某些压缩格式
如果您指定的 S3 存储桶包含 Macie 不支持的格式的文件,Macie 不会对它们进行分类。
压缩格式 https://docs.aws.amazon.com/macie/latest/userguide/macie-compression-archive-formats.html
加密对象 Macie 只能处理某些类型的加密 Amazon S3 对象有关更多详细信息,请参阅以下链接: https ://docs.aws.amazon.com/macie/latest/userguide/macie-integration.html#macie-encrypted-objects
梅西限制
Macie 对可在帐户中分类的数据量有默认限制。达到此数据限制后,Macie 将停止对数据进行分类。默认数据分类限制为 3 TB。如果需要,可以增加此值。
Macie 的内容分类引擎最多可处理 S3 对象的前 20 MB。
因此,特别是如果您的转储是压缩的,但在压缩中采用合适的格式,那么 Macie 可以分类,但重要的是,它只会分类文件的前 20 MB,如果文件很大,这是一个问题。
通常我使用 lambda 将一个大文件拆分为不到 20 MB 的文件。如果您有 X 个文件,您仍然需要考虑如何从已分类为 PII 的文件中获取记录并将其映射回可用的内容。
推荐阅读
- arrays - 在堆中声明数组时的无限空间
- laravel - 文件在 50 个文件上获取内容太慢
- c# - 如何在 ReactiveUI 中通过单击按钮设置 TextBox 值
- printing - 斑马标签 zpl 没有完全显示在物理但是虚拟打印中
- discord.py - 在 cogs 中找不到命令
- php - 为什么只匹配记录中的第一个单词?
- python - Transform all list arguments of all functions?
- machine-learning - How to use Drake with deep reinforcement learning
- r - R-Markdown中数字向量的均匀间距
- c++ - 加载图像但没有存储在其数组中(C++,stbi_load)