首页 > 解决方案 > 迭代 cte 中的随机值

问题描述

使用 SQL Server 2016+

我在从表中选择随机行时遇到了一些困难,该表已缩小到如何生成随机数的问题。为了提高效率,使用 aTOP 10 * ORDER BY NEWID()会减慢速度。在下面的代码中,我使用了一组种子来获得可重复的结果,但在现场我不会。

代码示例:

SELECT  RAND(100) RN
,       RAND()
,       RAND()
,       RAND()
,       RAND();

SELECT  RAND(100) RN
UNION ALL SELECT  RAND()
UNION ALL SELECT  RAND()
UNION ALL SELECT  RAND()
UNION ALL SELECT  RAND();

WITH cte AS
    (SELECT 1         ID
     ,      RAND(100) RN
     UNION ALL
     SELECT cte.ID + 1
     ,      RAND()
       FROM cte
      WHERE ID < 5)
SELECT  RN
  FROM  cte;

结果集

RN                                                                                          
---------------------- ---------------------- ---------------------- ---------------------- ----------------------
0.715436657367485      0.28463380767982       0.0131039082850364     0.28769876521071       0.100505471175005

(1 row affected)

RN
----------------------
0.715436657367485
0.28463380767982
0.0131039082850364
0.28769876521071
0.100505471175005

(5 rows affected)

RN
----------------------
0.715436657367485
0.28463380767982
0.28463380767982
0.28463380767982
0.28463380767982

(5 rows affected)

从结果中可以看出,当我调用RAND()内联或通过联合重复的函数时,每次调用都会得到不同的结果。但是,如果我在迭代 cte 中调用该函数,那么我会重复相同的值。

此代码是显示问题的示例,而不是整个代码集。我创建这个纯粹是为了演示这个问题。我有一个基于Checksum&NewID()和模数调用和乘法组合的解决方案,可以为我提供我想要的范围内的值,但这相当复杂,而且对于仅生成一个范围内的随机数列表来说似乎太过分了。

我正在寻找可以提供的任何指导

  1. 为什么会这样
  2. 解决问题的任何方法
  3. 生成随机数列表的其他选项(不是 RBAR)

非常感谢。

标签: sqlsql-serverrandomcommon-table-expression

解决方案


RAND()在查询中返回一个“常量”值。也就是说,查询中的每个“提及”都会对其进行一次评估。

如果你运行,你可以看到这个:

select rand(), rand()
from (values (1), (2), (3)) v(x);

每行有两个不同的值。但是,这些列具有相同的值。

无论如何,规范的答案是使用RAND(CHECKSUM(NEWID())). RAND()这为每次调用提供了一个随机种子:

WITH cte AS
    (SELECT 1 as ID, RAND(CHECKSUM(NEWID())) as RN
     UNION ALL
     SELECT cte.ID + 1, RAND(CHECKSUM(NEWID())) as RN
     FROM cte
     WHERE ID < 5
    )
SELECT RN
FROM cte;

这可能足以获得随机值列表。我怀疑你的真正问题是不同的——比如从表中提取随机行。如果这是真正的问题,请提出一个问题或检查类似问题。


推荐阅读