首页 > 解决方案 > Google Cloud DLP 使用确定性加密重新识别 PII 数据

问题描述

我正在尝试使用 Google 提供的文章 to re-identify Credit Card Number using Deterministic encryption using AES-SIV

https://cloud.google.com/solutions/creating-cloud-dlp-de-identification-transformation-templates-pii-dataset#creating_a_key_encryption_key_kek

因此,我创建了一个谷歌 DLP 模板来对数据进行去标识化,并且在模板的测试选项中,如果我们提供一个带有正确标题名称的 3 行 csv [我正在使用记录类型模板],它就可以工作

DLP 模板

DLP 模板测试

根据提供的以下链接和视频,可以使用相同的模板将数据重新识别回原始数据

“Cloud DLP 可以使用没有代理注释的 RecordTransformation 对整个列执行去标识化和重新标识化。”

https://cloud.google.com/dlp/docs/pseudonymization#cryptographic-hashing

但是当我们尝试相同时,它会再次将其重新编码为新编码的值,如下所示。

DLP 模板重新识别不起作用

请让我知道我做错了什么以及如何使用 AES-SIV 成功使用确定性加密重新识别 PII

注意:这是我在继续阅读前面的文章时遇到的相同行为,并且在博客中没有按预期工作以重新识别数据

https://cloud.google.com/solutions/validating-de-identified-data-bigquery-re-identifying-pii-data

标签: google-cloud-platformgoogle-cloud-dlppii

解决方案


您无法在控制台上重新进行身份验证,您需要为此使用 API。而且,因为你不使用代理前缀,你必须用 JSON 重建你的表(这样做很无聊......或者你可以编写脚本)。

您可以在此处获得 API的完整详细信息


JSON to peak:表(您的去标识表和模板使用)

{
  "item": {
    "table": {
      "headers": [
        {
          "name": "id"
        },
        {
          "name": "phone"
        },
        {
          "name": "email"
        }
      ],
      "rows": [
        {
          "values": [
            {
              "stringValue": "1"
            },
            {
              "stringValue": "ASoxvJC6oo4fCgKm+ppgT6j2lSqdj179SbLc"
            },
            {
              "stringValue": "ARkspehZ720J0f/r5zqlVN65PS756cxQDbwSniZ+g8iV"
            }
          ]
        },
        {
          "values": [
            {
              "stringValue": "2"
            },
            {
              "stringValue": "ATfmBVs25TEGYHLu+6DBBhpq6dk8LSJq+XyR"
            },
            {
              "stringValue": "AZZhJLTmQKjlcXEROCRPu9u81G98/SBac/AlWXwtgiYe"
            }
          ]
        }
      ]
    }
  },
  "reidentifyTemplateName": "projects/<YOUR_PROJECT>/locations/global/deidentifyTemplates/test-email-DeId"
}

我将内容保存在一个名为:dlpdata.json

调用 API 的 curl 请求

curl -H "Content-type: application/json"  \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -X POST -d @dlpdata.json \
     https://dlp.googleapis.com/v2/projects/<YOUR_PROJECT>/content:reidentify

推荐阅读