google-cloud-platform - Apache Beam 中的处理时间和事件时间有什么区别
问题描述
根据 Apache Beam 文档
“事件时间”由数据元素本身的时间戳决定
“处理时间”,由处理元素的系统上的时钟确定
我的数据是一个 json 文件,我的所有字段都不是时间戳。在这种情况下,我的活动时间是什么时候?
我正在通过 Pub/Sub 摄取数据并使用 Cloud Dataflow 处理数据
解决方案
在这种情况下,“事件时间”是事件发布到主题的时间。因此,例如,如果您的数据流无法以发布频率处理已发布的事件,那么事件时间将滞后,因此您的数据流中的系统延迟将增加。
推荐阅读
- html - 关于 HTML 文件路径的说明
- r - 如何省略do.call产生的大量代码?
- google-meet - Meet Enhancer Suite 中的演示模式
- arduino - 阿杜诺项目
- asp.net-core - 使用 https 和命令行运行 ASP.NET 核心编译的应用程序
- java - 找不到从 Groovy 到 Java 的匹配方法
- java - Java - 通过单击 GUI 对象捕获调用堆栈或断点
- c# - 将 Xamarin 图像保存到文件
- swift - Swift Alamofire 构建错误标识符名称违规
- mysql - MYSQL:如何选择购买了一种产品但没有购买另一种产品的客户