sql - 在水印之后立即使用 flatMap 时,Spark DF 会丢失水印
问题描述
使用
df
.watermark(...)
.flatMap(row => Iterator(f(row)))
将“丢失”水印,这意味着它将报告:
... is not supported with append output mode on a streaming dataframe/dataset
.
是否有可能flatMap
在某种程度上不会创建一个单独的聚合组?我可以看到 Spark 是在后台实现flatMap
的mapPartitions
。
解决方案
推荐阅读
- laravel - Laravel 的注入请求对象与 `request()` 收到的不同
- excel - 在 Excel VBA 中获取带一位小数的双变量溢出错误
- c++ - 变量前向声明 - LNK1120 错误(未解决的外部)
- java - 在 Eclipse 中,如何运行引用一个类的所有 junit 测试
- python - 不会打印项目列表,只打印列表中的第一项
- oracle - HY010 SSIS 中的 Oracle ODBC 函数序列错误?
- azure - ImagePullBackOff 未经授权:需要身份验证
- javascript - 浏览器需要 HTTP 响应,但服务器不允许多个响应
- parsing - 除了叶子,如何创建相同的树?
- c - 如何在C中实现多关键字搜索?