首页 > 解决方案 > Azure SQL DW - 标识列值

问题描述

我将主键/复合键插入到带有identity(1,1) bigint列的中间数据库表中。在更传统的关系数据库中,对于表中的每个新键,该列都会增加 1,从而为这些值创建一个代理键。但是,在 Azure SQL DW 中,这些值是不连续的,如文档中所述:

IDENTITY 属性不保证代理值的分配顺序,这反映了 SQL Server 和 Azure SQL 数据库的行为。但是,在 Azure SQL 数据仓库中,缺乏保证更为明显。

因此,id我的表中只有 4 个唯一值的列将如下所示:

id, 1, 6, 8, 20id, 1, 2, 3, 4

我知道我可以通过使用表中代理列的row_number()函数和 a自己创建代理键来解决这个问题。但是,我担心这不是 Azure SQL DW 的意图,并且会影响数据库性能。maxid

declare @current_val as bigint = (select coalesce(max(id), 0) from dbo.reseeding_table);

因此,我担心 ididentity列的值会因为 Azure 的实现方式而超过其限制。我应该相信 Azure SQL DW 的identity列的功能吗?

标签: identity-columnazure-sqldw

解决方案


正如 Greg Galloway 所指出的,这个问题与最近关于序列值的主题非常相似。

因为您提出了几个具体的问题,我认为它的不同之处足以需要自己的答案。

  1. 使用 row_number() 不会影响性能。我一直使用它而不是 IDENTITY。

  2. 您绝对可以信任身份功能。您可能已经注意到,这些数字会随着配置中的节点数而增加,这不是随机的。你总会得到一个新号码。

需要注意的是,您不应该一次插入一行,如果您担心顺序 ID,您可能会这样做。您会发现单次插入非常慢,如果由多个进程执行,可能会导致并发问题。考虑对您的数据进行微批处理,并使用 Polybase 加载它以获得最佳性能。


推荐阅读