databricks - Azure Databricks 定价:B2B 订阅与官方页面定价
问题描述
我从一家公司了解到,用于 B2B 非生产订阅的 50,000 个 DBU 的成本可能约为 44,000 美元。反过来,在 Databricks 官方定价页面上,最优质的层成本为 0.55 美元/DBU(每 50k DBU 为 27,500 美元)。
您能否解释一下 B2B 订阅 DBU 和官方页面 Data Analytics Pemium SKU DBU 之间的区别?
为什么定价差异如此之大?除了支持/快速通道之外,还有其他(作为 B2B 的一部分)吗?
希望您不需要发布私人信息来回答我的问题。但我需要了解主要原因,以便能够为未来的项目计划成本。
UPD
Databricks B2B 订阅不为您提供不同使用层(灯光/工程/分析)的选择。相反,每个捆绑包(DBU 卷)都有一个选项(价格)。该选项比最昂贵的分析层要贵得多。
解决方案
可以将其视为获得价值 50,000 美元的代币的折扣。即使您支付了 46,000 美元,您运行流程的方式也会从该桶中提取,就好像您有 50,000 美元要花费一样。你有一年或三年的时间花掉它们,如果你不在那个时间范围内花掉它们,你就会失去剩下的。如果您通过所有这些,您将支付现收现付的价格,或者您可以预先购买另一年或 3 年的单位桶。此外,您如何运行您的工作以及您在哪个等级(标准或高级)下运行将决定您在单位桶中燃烧的速度,并且正如前面的答案所述仍然很重要。
https://azure.microsoft.com/en-us/pricing/details/databricks/
Databricks Unit 预购计划
将 Azure Databricks 单元 (DBU) 作为 Databricks 提交单元 (DBCU) 预购买 1 年或 3 年,可以比即用即付 DBU 价格节省高达 37% 的费用。Databricks 提交单元 (DBCU) 将 Azure Databricks 工作负载和层的使用规范化为一次购买。您在这些工作负载和层中的 DBU 使用量将从 Databricks 提交单元 (DBCU) 中提取,直到它们用完或购买期限到期。根据上表,提取率将等同于 DBU 的价格。
DBCU 购买的购买等级和折扣如下所示:
1年预购计划
DATABRICKS 提交单位 (DBCU) 价格(有折扣) 折扣
25,000 美元 23,500 美元 6%
50,000 美元 46,000 美元 8%
100,000 美元 89,000 美元 11%
200,000 美元 172,000 美元 14%
350,000 美元 287,000 美元 18%
500,000 美元 400,000 美元 20%
750,000 美元 578,000 美元 22%
1,000,000 美元 730,000 美元 27%
1,500,000 美元 1,050,000 美元 30%
2,000,000 美元 1,340,000 美元 33%
此外,Analytics/Engineering/Light 也不是您可以选择的选项。它们由您运行工作的方式定义。通过笔记本界面执行作业被定义为分析作业,其中好像您计划运行被视为工程作业的笔记本,并且如果您使用编码库提交作业,则您正在轻型层下运行。
更新 - 评论部分没有足够的空间来回答 OP 回复
非常感谢您的回答!我想我弄错了,但请再次批准。所以 DBCU 大约是美元,所以 50k DCBUs 可能等于 100k DBUs,对吧?
DBUs 和 DBCUs 完全一样,并且根据使用情况收费。唯一的区别是,以预购 50,000 为例,您可以获得 8% 的预付折扣。如果您要在两个不同的工作空间中运行完全相同的所有内容,并且您在一个工作空间中花费了 50,000 DBU 小时,而在另一个工作空间中花费了 50,000 DBCU 小时,那么您将在一年中欠 50,000 美元,或者您需要预付 46,000 美元。这些都不包括您应支付给 Azure 的实际 VM 基本成本。DBU 结构是 Databricks 的成本削减,因此您必须将其计入总成本。
我也花了一段时间才弄清楚我什么时候开始使用数据块。当他们说您为每 DBU 小时处理的分析作业收取 0.55 美元而不是每个作业 0.55 美元时。因此,如果我运行 1 小时的分析作业,我会烧掉 0.55 *(VM 的数量 * VM DBU 每小时成本)。如果我以每小时 1/2 的时间运行相同的工作,我将被收取 (.55*.5) * (VM 的数量 * (VM DBU 成本*.5))。将 DBU 和 DBCU 单位视为 1 单位 = 1 美元更容易,并且您正在消耗每秒计算的美元价值而不是单位计数。在我看来,显示 0.55 美元/DBU 的定价网格应该标记为 0.55 美元/DBU 小时。我花了很长时间,几个电话和一个 poc,才弄清楚。
至于你的第二个问题
通过 REST API 调度作业比通过 ADF => Notebook 调度更有益,对吧?
同样,这个问题看起来应该更复杂。我最初说是的更好,我没有抓住问题的 ADF 部分。您可以通过 ADF 运行工程作业,方法是使用作业集群选项来运行笔记本。如果您通过 ADF 将笔记本连接到预制分析集群,您将支付分析成本。使用 API,您可以在 databricks 提供的内置作业调度程序中安排您的笔记本。我的理解是,如果是工作库,则按笔记本的工程师级别和轻型级别收费。
如果你走这条路,在预购时要问的另一件事是能够将单元桶附加到你的开发/测试环境和生产环境。我们将它们保持完全独立的网络,因此我们有两个工作区。两者都可以从同一个单位池中拉取。取决于您的天蓝色设置。我们在设置 Databricks 时进行了销售,但微软应该也可以这样做。
推荐阅读
- iis - 可以帮我解决 0x80070021 错误吗
- javascript - Array.fill().map() 在反应中不起作用
- svelte - Svelte 不更新子组件
- kubernetes - Kubernetes 上的 EventStore:连接被拒绝
- functional-programming - Ramda applySpec - 保留未修改的道具
- gps - 将纬度/经度坐标转换为基本方向
- c - GTK3 菜单为空
- kubernetes - 有没有办法列出特定操作员创建的所有资源及其状态?
- git - 如何在 git 冲突解决中根据时间线了解最新提交的文件?
- ios - 应用商店上传失败,即使包标识符是正确的