python - 如何使用python在列中找到常见的序列模式?
问题描述
我有一个大型数据集,如下所示:
时间戳事件
2020-03-04 01:20:39 A
2020-03-04 01:21:22 B
2020-03-04 01:21:55 C
2020-03-04 01:22:31 A
2020-03- 04 01:23:19 B 2020-03-04
01:24:39
D。
. . .
. . . .
2020-03-10 11:34:54 C
2020-03-10 11:35:22 A
2020-03-04 11:35:55 B
2020-03-04 11:36:01 D
我想找出事件发生中是否存在一些模式。例如,在第 1 行的事件 A 之后,B 在第 2 行发生。{A,B} 是在第 4 行和第 5 行重复的模式。我想知道是否还有更多这样的模式及其频率。我对最大长度为 4 的序列感兴趣(例如:C、A、B、D)。
如果您可以向我建议任何在 python 中的算法/实现来做到这一点,那将非常有帮助。
谢谢!
解决方案
你试过 PM4Py python 库吗?您需要按照此处的说明将数据转换为事件日志,它将自动提取序列。
推荐阅读
- ios - ScrollView 中的动画缺少 SwiftUI 中的最后一个对象
- javascript - 当 textarea 替换为 input type = text 时,编写和解码编码消息的程序会出现故障
- apache-nifi - 我正在尝试将 pl/sql 命令发送到 oracleAQ
- java - 使用Java分组后如何在Spark Dataframe的每一行上应用函数
- java - Spring Data Cassandra 在数据库中两次插入后在 PT2S 后抛出 Query timed out
- excel - 即使 Exact 与特定引用一起使用,索引匹配和 Exact 的 Excel 结果也不起作用
- c# - ASP.NET MVC 4:尝试从输入文本框在 Sql Server 数据库中插入日期时间字段时收到错误
- c# - C# Jagged Array,确定是否有任何对匹配
- javascript - DOMException: play() 失败,因为用户没有先与文档交互(音频呼叫响铃)
- jquery - 单击具有相同班级的班级时显示和隐藏表格的最佳方式