amazon-s3 - 如何使用 Python Jupyter Notebook 通过 KMS 加密从 S3 读取文件
问题描述
我正在尝试使用 spark.read.csv 从 S3 读取文件。但是,我无法读取具有 KMS 加密的文件。我有可用的 KMS 密钥。如何在配置时在 spark 会话中指定它们。
解决方案
对于 SSE-KMS,它是自动的:当文件被加密时,密钥 ID 与对象一起存储,为了解密文件 S3 端它直接与 KMS 对话进行解密(如果您可以读取密钥)
对于客户端,AWS EMR 确实支持这一点。开源 S3A 连接器没有,因为多年来 S3 客户端加密总是填充数据,因此事情会中断。现在情况有所改变,但没有人(2021 年 1 月)提供补丁
推荐阅读
- database - Neo4J 复合索引支持哪些类型的过滤器
- javascript - 结合 requestFullscreen 和 F11
- python - 从偏好列表中找到可行的组合
- vuejs2 - 在返回数据之前阻止页面呈现
- java - Content Provider 的 query() 方法在回收器视图适配器中返回数据两次
- windows - 克隆 git 后如何构建 MSBuild.exe
- json - 这是使用 JSON(和 geoJSON)指定多边形位置的正确方法吗?
- php - PHP mysql 选择 MAX()
- angular - 角度组件不会被垃圾收集
- spring - Spring boot MVN clean package 仅在 EC2 实例中需要更多时间