首页 > 解决方案 > Azure Databricks 定价:B2B 订阅与官方页面定价

问题描述

我从一家公司了解到,用于 B2B 非生产订阅的 50,000 个 DBU 的成本可能约为 44,000 美元。反过来,在 Databricks 官方定价页面上,最优质的层成本为 0.55 美元/DBU(每 50k DBU 为 27,500 美元)。

您能否解释一下 B2B 订阅 DBU 和官方页面 Data Analytics Pemium SKU DBU 之间的区别?

为什么定价差异如此之大?除了支持/快速通道之外,还有其他(作为 B2B 的一部分)吗?

希望您不需要发布私人信息来回答我的问题。但我需要了解主要原因,以便能够为未来的项目计划成本。

UPD

Databricks B2B 订阅为您提供不同使用层(灯光/工程/分析)的选择。相反,每个捆绑包(DBU 卷)都有一个选项(价格)。该选项比最昂贵的分析层要贵得多。

标签: databricksazure-databricks

解决方案


可以将其视为获得价值 50,000 美元的代币的折扣。即使您支付了 46,000 美元,您运行流程的方式也会从该桶中提取,就好像您有 50,000 美元要花费一样。你有一年或三年的时间花掉它们,如果你不在那个时间范围内花掉它们,你就会失去剩下的。如果您通过所有这些,您将支付现收现付的价格,或者您可以预先购买另一年或 3 年的单位桶。此外,您如何运行您的工作以及您在哪个等级(标准或高级)下运行将决定您在单位桶中燃烧的速度,并且正如前面的答案所述仍然很重要。

https://azure.microsoft.com/en-us/pricing/details/databricks/

Databricks Unit 预购计划

将 Azure Databricks 单元 (DBU) 作为 Databricks 提交单元 (DBCU) 预购买 1 年或 3 年,可以比即用即付 DBU 价格节省高达 37% 的费用。Databricks 提交单元 (DBCU) 将 Azure Databricks 工作负载和层的使用规范化为一次购买。您在这些工作负载和层中的 DBU 使用量将从 Databricks 提交单元 (DBCU) 中提取,直到它们用完或购买期限到期。根据上表,提取率将等同于 DBU 的价格。

DBCU 购买的购买等级和折扣如下所示:

1年预购计划

DATABRICKS 提交单位 (DBCU) 价格(有折扣) 折扣

25,000 美元 23,500 美元 6%

50,000 美元 46,000 美元 8%

100,000 美元 89,000 美元 11%

200,000 美元 172,000 美元 14%

350,000 美元 287,000 美元 18%

500,000 美元 400,000 美元 20%

750,000 美元 578,000 美元 22%

1,000,000 美元 730,000 美元 27%

1,500,000 美元 1,050,000 美元 30%

2,000,000 美元 1,340,000 美元 33%

此外,Analytics/Engineering/Light 也不是您可以选择的选项。它们由您运行工作的方式定义。通过笔记本界面执行作业被定义为分析作业,其中好像您计划运行被视为工程作业的笔记本,并且如果您使用编码库提交作业,则您正在轻型层下运行。

更新 - 评论部分没有足够的空间来回答 OP 回复

非常感谢您的回答!我想我弄错了,但请再次批准。所以 DBCU 大约是美元,所以 50k DCBUs 可能等于 100k DBUs,对吧?

DBUs 和 DBCUs 完全一样,并且根据使用情况收费。唯一的区别是,以预购 50,000 为例,您可以获得 8% 的预付折扣。如果您要在两个不同的工作空间中运行完全相同的所有内容,并且您在一个工作空间中花费了 50,000 DBU 小时,而在另一个工作空间中花费了 50,000 DBCU 小时,那么您将在一年中欠 50,000 美元,或者您需要预付 46,000 美元。这些都不包括您应支付给 Azure 的实际 VM 基本成本。DBU 结构是 Databricks 的成本削减,因此您必须将其计入总成本。

我也花了一段时间才弄清楚我什么时候开始使用数据块。当他们说您为每 DBU 小时处理的分析作业收取 0.55 美元而不是每个作业 0.55 美元时。因此,如果我运行 1 小时的分析作业,我会烧掉 0.55 *(VM 的数量 * VM DBU 每小时成本)。如果我以每小时 1/2 的时间运行相同的工作,我将被收取 (.55*.5) * (VM 的数量 * (VM DBU 成本*.5))。将 DBU 和 DBCU 单位视为 1 单位 = 1 美元更容易,并且您正在消耗每秒计算的美元价值而不是单位计数。在我看来,显示 0.55 美元/DBU 的定价网格应该标记为 0.55 美元/DBU 小时。我花了很长时间,几个电话和一个 poc,才弄清楚。

至于你的第二个问题

通过 REST API 调度作业比通过 ADF => Notebook 调度更有益,对吧?

同样,这个问题看起来应该更复杂。我最初说是的更好,我没有抓住问题的 ADF 部分。您可以通过 ADF 运行工程作业,方法是使用作业集群选项来运行笔记本。如果您通过 ADF 将笔记本连接到预制分析集群,您将支付分析成本。使用 API,您可以在 databricks 提供的内置作业调度程序中安排您的笔记本。我的理解是,如果是工作库,则按笔记本的工程师级别和轻型级别收费。

如果你走这条路,在预购时要问的另一件事是能够将单元桶附加到你的开发/测试环境和生产环境。我们将它们保持完全独立的网络,因此我们有两个工作区。两者都可以从同一个单位池中拉取。取决于您的天蓝色设置。我们在设置 Databricks 时进行了销售,但微软应该也可以这样做。


推荐阅读