apache-spark - 什么是窗口标准?
问题描述
Apache Spark 是基于时间的窗口标准,而 Flink 是基于记录的窗口标准。
任何机构都可以详细解释什么是窗口标准?
解决方案
通过标准,它们意味着谓词或条件。例如,每 2 分钟触发一个窗口。Flink 的重点在于 Flink 是一个基于记录的流引擎。它一次处理每条记录。而 Spark 有微批次,它会在微批次的时间范围内处理所有事件。Flink 有翻滚、滑动、会话和全局窗口的概念。
下面有来自链接的简短解释(https://ci.apache.org/projects/flink/flink-docs-stable/dev/stream/operators/windows.html#window-assigners)。但是您可以在链接上找到带有数字的详细说明。
翻滚窗口分配器将每个元素分配给指定窗口大小的窗口。滑动窗口分配器将元素分配给固定长度的窗口。会话窗口分配器按活动会话对元素进行分组。全局窗口分配器将具有相同键的所有元素分配给同一个全局窗口。
推荐阅读
- spring - Spring boot maven可执行jar没有双击运行
- mysql - 根据日期将排名编号分配给可能重复的行
- android - 如何将来自服务器的所有响应插入到明确的答案类别中?
- mysql - GROUP 列,其中其他列条件为 AND
- c# - 在 C# 中的 Visual Studio 上的 Windows 窗体应用程序中使用帮助文件 (.sh6)
- angular - Angular 6 和 Sharepoint SPFX
- javascript - 如何使用 Vue.js 获取渲染 dom 元素的组件
- oracle - Oracle - 如果变量为空
- javascript - 如何从 JavaScript 文件访问 c# 变量?
- javascript - 不更新模态体