sql - SQL中的棘手分区
问题描述
我有一张这样的桌子
RID ID DTE FLAG AMT SUMAMT
1 1 2020-07-03 02:52:15.480 Y 10 NULL
2 1 2020-07-04 02:52:15.480 N 10 NULL
3 1 2020-07-05 02:52:15.480 N 10 NULL
4 1 2020-07-06 02:52:15.480 Y 10 NULL
5 1 2020-07-13 02:52:15.480 Y 10 NULL
6 2 2020-07-06 02:52:15.480 N 10 NULL
7 2 2020-07-13 02:52:15.480 Y 10 NULL
我需要这样的结果
RID ID DTE FLAG AMT SUMAMT
1 1 2020-07-03 02:52:15.480 Y 10 10
2 1 2020-07-04 02:52:15.480 N 10 NULL
3 1 2020-07-05 02:52:15.480 N 10 NULL
4 1 2020-07-06 02:52:15.480 Y 10 30
5 1 2020-07-13 02:52:15.480 Y 10 10
6 2 2020-07-06 02:52:15.480 N 10 NULL
7 2 2020-07-13 02:52:15.480 Y 10 20
我在这里需要做的就是更新 'Y' FLAG 行项目的 SUMAMT 列。这里的条件是每当我们找到'Y' FLAG时,我们需要检查过去是否有任何'N'标记的行项目基于DTE,如果是我们需要对该行项目进行AMT并需要总结和更新苏玛特。
SELECT RID,ID,DTE,FLAG,AMT,SUM(AMT) OVER (PARTITION BY ID ORDER BY ID,DTE) FROM #T
我尝试了上面的查询,它给出了运行总数,我不明白如何制作如下所述的分区......
RID ID DTE FLAG AMT SUMAMT
1 1 2020-07-03 02:52:15.480 Y 10 10
2 1 2020-07-04 02:52:15.480 N 10 NULL
3 1 2020-07-05 02:52:15.480 N 10 NULL
4 1 2020-07-06 02:52:15.480 Y 10 30
5 1 2020-07-13 02:52:15.480 Y 10 10
6 2 2020-07-06 02:52:15.480 N 10 NULL
7 2 2020-07-13 02:52:15.480 Y 10 20
查询创建表和插入数据...
CREATE TABLE #T
(
RID INT IDENTITY(1, 1),
ID INT,
DTE DATETIME,
FLAG VARCHAR(1),
AMT INT,
SUMAMT INT
)
INSERT INTO #T (ID, DTE, FLAG, AMT)
VALUES (1, GETDATE() - 10, 'Y', 10),
(1, GETDATE() - 9, 'N', 10),
(1, GETDATE() - 8, 'N', 10),
(1, GETDATE() - 7, 'Y', 10),
(1, GETDATE(), 'Y', 10),
(2, GETDATE() - 7, 'N', 10),
(2, GETDATE(), 'Y', 10)
解决方案
感谢您的示例数据。这很有帮助。
在下面的查询中,我们将数据分成两部分:
- 标记“Y”
- 标记“N”
现在,我们计算落在两个“Y”标志之间的所有标志“N”行的总和。对于标志“N”行,没有计算。
SELECT t.RID, t.id, t.dte, t.amt,t.flag, isnull(t.amt+ot.sum_amt,amt)
from
(SELECT
RID,ID, DTE, ISNULL(LAG(DTE,1) OVER(PARTITION BY ID ORDER BY DTE),'19000101') AS Prev_Yes
, DTE as Current_Yes
,amt
,flag
FROM #t as cr WHERE Flag = 'Y') as t
OUTER APPLY
(SELECT SUM(AMT) FROM #t
WHERE flag = 'N'
AND DTE > t.Prev_Yes AND DTE < t.Current_Yes
and ID = t.id) as ot(sum_amt)
UNION ALL
SELECT RID, id, dte, amt,flag, NULL AS SUM_AMT
FROM #t
WHERE flag = 'N'
ORDER BY rid
+-----+----+-------------------------+-----+------+------------------+
| RID | id | dte | amt | flag | (No column name) |
+-----+----+-------------------------+-----+------+------------------+
| 1 | 1 | 2020-07-03 09:35:10.513 | 10 | Y | 10 |
| 2 | 1 | 2020-07-04 09:35:10.513 | 10 | N | NULL |
| 3 | 1 | 2020-07-05 09:35:10.513 | 10 | N | NULL |
| 4 | 1 | 2020-07-06 09:35:10.513 | 10 | Y | 30 |
| 5 | 1 | 2020-07-13 09:35:10.513 | 10 | Y | 10 |
| 6 | 2 | 2020-07-06 09:35:10.513 | 10 | N | NULL |
| 7 | 2 | 2020-07-13 09:35:10.513 | 10 | Y | 20 |
+-----+----+-------------------------+-----+------+------------------+
推荐阅读
- google-cloud-run - Cloud Run - 使用通配符子域的自定义域映射
- google-cloud-platform - 调整 GKE 以加快分配和分配 IP 给新服务的速度
- php - MapBox addLayer/addSource 不添加从 php 创建的 geoJson 的点
- sql-server - 在 SQL 中粉碎 XML 但交叉应用会添加不需要的记录
- c# - 发送电子邮件始终返回 5.7.3 身份验证不成功代码或身份验证失败的某些变体
- twilio - 通过 SMS 自动化发送唯一代码
- android - android studio 应用程序文件夹丢失。如何再次显示?
- asp.net-core - 如何对 Azure AD 中特定区域的用户进行身份验证和授权?
- mysql - 在 MySQL 源上启用 CDC 时,AWS DMS“不支持或注释掉 DDL”
- database - 基于名称类别在 ms 访问中创建新列