azure-synapse - Blob 存储文件夹备份
问题描述
- 我们在突触工作区中有很多管道。
- 使用设置为在线的无服务器 sqlpool
- 专用 sql 池已暂停,因为我们不使用它来保存数据...
- 使用 DevOps 存储库
- 支持团队将在环境中进行一些清理。即运行旧的 terraform 以重新创建环境等。如何确保
问题:我了解到,在我们的 DevOps 存储库中,除了 blob 存储文件夹外,所有内容似乎都已备份......我们如何确保如果在工作区清理过程中丢失/或出错,我们将能够找回一切……?
谢谢
解决方案
ADLS Gen2 有自己的工具来确保 DR 事件不会影响您。最强大的工具之一是复制,包括异地复制存储选项。
Data Lake Storage Gen2 已经在后台处理了 3 次复制,以防止出现局部硬件故障。此外,其他复制选项(例如 ZRS 或 GZRS)可以提高 HA,而 GRS 和 RA-GRS 可以提高 DR。在为 HA 制定计划时,如果发生服务中断,工作负载需要通过切换到本地或新区域中的单独复制实例来尽快访问最新数据。
在 DR 策略中,为应对不太可能发生的区域灾难性故障事件,使用 GRS 或 RA-GRS 复制将数据复制到不同区域也很重要。您还必须考虑您对边缘情况的要求,例如数据损坏,您可能希望创建定期快照以回退到这些情况。根据数据的重要性和大小,根据风险容忍度考虑 1 小时、6 小时和 24 小时周期的滚动增量快照。
对于 Data Lake Storage Gen2 的数据弹性,建议通过满足 HA/DR 要求的 GRS 或 RA-GRS 对数据进行异地复制。此外,您应该考虑使用 Data Lake Storage Gen2 的应用程序通过监控触发器或失败尝试的长度自动故障转移到辅助区域的方法,或者至少向管理员发送通知以进行手动干预。请记住,故障转移与等待服务重新上线之间存在权衡。
有关更多详细信息,请参阅使用 Azure Data Lake Storage Gen2 的最佳做法。
还有一篇很棒的文章,其中谈到:Azure Synapse 灾难恢复架构。
推荐阅读
- rest - 无法调用 TFS 2017 REST API
- android - 在 Retrofit 和 @Body 注解中使用 PATCH 方法
- javascript - 如何将 javascript 变量传递到 java servlet doPost
- android - 麦克风从手机扬声器拾取声音产生反馈
- mysql - apache Drill - 它是否支持具有相同存储插件的 mysql 内部连接
- python - 将 pyModbus 数据检索到列表中
- r - R闪亮错误:在eventReactive和Desctools中使用时找不到对象'输入'
- excel - 隐藏工作表上的所有对象
- typescript - 为什么 ngSubmit 绑定到表单中的所有按钮
- google-api - 在 Google Analytics API for Postman 中获取令牌