首页 > 解决方案 > 在一个非常大的数据集中找到一个不同长度的数组中的先前值,以提高内存效率,而它目前无法完成

问题描述

该示例是一个呼叫日志,其中包含 100 毫升以上的行和呼叫组,它们是同一呼叫的分支,以查看呼叫分支是否大于一个,下一个和上一个代表是什么

数据来自 cisco ucce,在尝试它时,我无法在如此庞大的 200+ml 行上完成它

我在 Excel、Access 中的查询都不起作用,我想不出如何在 SQL Server 中完成它。

在构建这个特定的 CTE 时,我找不到合适的搜索词或要审查的材料。

谁能指出我正确的方向

select routerkey, routerkeyday, sequence number, name, queue, concat(routerkey, routerkeyday) as callgroupkey
from log
where date >= '1/1/2020'
group by callgroupkey 

使用它,我可以在 Excel 中一天进行两次或三次查找,但似乎无法超越这一点,因为它已经数百万了。

我没有样本,但这里是数据库模式的副本

标签: pythonsqlsql-serverdatabase

解决方案


推荐阅读