python - 在一个非常大的数据集中找到一个不同长度的数组中的先前值,以提高内存效率,而它目前无法完成
问题描述
该示例是一个呼叫日志,其中包含 100 毫升以上的行和呼叫组,它们是同一呼叫的分支,以查看呼叫分支是否大于一个,下一个和上一个代表是什么
数据来自 cisco ucce,在尝试它时,我无法在如此庞大的 200+ml 行上完成它
我在 Excel、Access 中的查询都不起作用,我想不出如何在 SQL Server 中完成它。
在构建这个特定的 CTE 时,我找不到合适的搜索词或要审查的材料。
谁能指出我正确的方向
select routerkey, routerkeyday, sequence number, name, queue, concat(routerkey, routerkeyday) as callgroupkey
from log
where date >= '1/1/2020'
group by callgroupkey
使用它,我可以在 Excel 中一天进行两次或三次查找,但似乎无法超越这一点,因为它已经数百万了。
我没有样本,但这里是数据库模式的副本
解决方案
推荐阅读
- bash - bash stdout 一些信息并从内部循环管道其他信息
- python - 如何将PK传递给方法装饰器
- spring-boot - 不能只获取管理员用户
- stripe-payments - 为拆分付款设置 Stripe Connect
- arduino - HM-10 在不知道 MAC 地址的情况下与另一个 HM-10 配对
- xml - 如何在没有命名空间的情况下访问 XML 元素
- r - 将xy坐标转换为R中三元图的三元空间
- sql - 稳定 Maria DB 上的 MEDIAN() 窗口函数
- java - 如何在不重复字符的情况下找到最长的子字符串?
- c - 最佳实践 lkm 劫持输入,有合法的方法吗?