identity-column - Azure SQL DW - 标识列值
问题描述
我将主键/复合键插入到带有identity(1,1) bigint
列的中间数据库表中。在更传统的关系数据库中,对于表中的每个新键,该列都会增加 1,从而为这些值创建一个代理键。但是,在 Azure SQL DW 中,这些值是不连续的,如文档中所述:
IDENTITY 属性不保证代理值的分配顺序,这反映了 SQL Server 和 Azure SQL 数据库的行为。但是,在 Azure SQL 数据仓库中,缺乏保证更为明显。
因此,id
我的表中只有 4 个唯一值的列将如下所示:
id, 1, 6, 8, 20
与
id, 1, 2, 3, 4
我知道我可以通过使用表中代理列的row_number()
函数和 a自己创建代理键来解决这个问题。但是,我担心这不是 Azure SQL DW 的意图,并且会影响数据库性能。max
id
declare @current_val as bigint = (select coalesce(max(id), 0) from dbo.reseeding_table);
因此,我担心 ididentity
列的值会因为 Azure 的实现方式而超过其限制。我应该相信 Azure SQL DW 的identity
列的功能吗?
解决方案
正如 Greg Galloway 所指出的,这个问题与最近关于序列值的主题非常相似。
因为您提出了几个具体的问题,我认为它的不同之处足以需要自己的答案。
使用 row_number() 不会影响性能。我一直使用它而不是 IDENTITY。
您绝对可以信任身份功能。您可能已经注意到,这些数字会随着配置中的节点数而增加,这不是随机的。你总会得到一个新号码。
需要注意的是,您不应该一次插入一行,如果您担心顺序 ID,您可能会这样做。您会发现单次插入非常慢,如果由多个进程执行,可能会导致并发问题。考虑对您的数据进行微批处理,并使用 Polybase 加载它以获得最佳性能。
推荐阅读
- c++ - 带有 vcpkg 和 cmake 的简单 C++ 项目:无法使用已安装的库运行
- node.js - 尝试在 express.js 框架中本地使用 Fontawesome 字体时出现 404 错误
- postgresql - 如何删除多个重复的几何图形?
- node.js - NodeJS params.Example 未被@sendgrid/mail 使用
- node.js - 如何使用 Nodemailer 在密件抄送中发送电子邮件
- python - pyHook 钩子使输入过于滞后 - 有没有办法优化这些钩子?
- ios - 从 nib 文件所有者加载 ViewController
- datetime - 为什么在 OffsetDateTime 日期格式中使用 'T' - java 8
- html - 固定底部不适用于有溢出的父级
- ios - 当应用程序终止并且它还处于活动状态时,功能不起作用