首页 > 解决方案 > 使用现有数据在 Redshift 集群上启用加密

问题描述

我负责在拥有大量现有数据的 Redshift 集群上启用加密。基于此链接,我知道启用后它将创建一个新集群并在此期间以只读方式访问它并复制现有数据。我们有许多针对 Redshift 集群运行的 ETL 作业,我正在尝试确定迁移需要多长时间。是否有任何基于数据大小/节点类型/集群配置的可用估计?

标签: encryptionamazon-redshift

解决方案


是否有任何基于数据大小/节点类型/集群配置的可用估计?

基本上,没有。这需要多长时间取决于许多因素,其中一些因素超出了您的控制范围,因此很难预测。

您绝对应该首先对此进行测试,以便了解其含义以及可能需要多长时间,例如

  • 通过还原原始集群的快照来创建一个新的、相同的集群
  • 按照步骤加密集群并记录所用时间
  • 理想情况下,使用加密集群测试您现有的 ETL 作业
  • 删除测试集群

根据我在调整集群大小方面的经验(类似但不相同的练习),由于本地 AWS 资源、网络流量等的可变性,我将允许您的测试时间有 +/- 10-15% 的余量。

如果可能的话,我建议终止与集群的所有连接以加快进程。我们发现一个经常轮询我们的集群的进程导致调整大小的过程需要更长的时间。

作为参考点,一个 20 节点的 ds 集群,大约有 20 个节点。25 Tb 的数据需要大约 20 小时才能调整大小。


推荐阅读