apache-flink - 我可以使用 Flink 的文件系统连接器作为查找表吗?
问题描述
Yarn 上的 Flink 1.13.2 (Flink SQL)。
有点困惑 - 我发现了两种(据我所知)不同规格的文件系统连接器(Ververica.com vs ci.apache.org):
https://ci.apache.org/projects/flink/flink-docs-master/docs/connectors/table/overview/#supported-connectors - 文件系统是“有界和无界扫描,查找”
https://docs.ververica.com/user_guide/sql_development/connectors.html#packaged-connectors — 仅标记为可用于查找的 JDBC。
我可以使用文件系统连接器 (csv) 创建查找(维度)表来丰富 Kafka 事件表吗?如果是 - 如何使用 Flink SQL?
(我尝试过简单FOR SYSTEM_TIME AS OF a.event_datetime
的左连接 - 它适用于测试环境中的少量 Kafka 事件,但在生产中GC overhead limit exceeded
出现错误。我猜这是因为没有将小型 csv 表广播到工作节点。在 Spark 中,我曾经解决这些问题使用相关提示输入问题。)
解决方案
文件系统连接器不应用作查找,因为查找访问需要索引访问。我们应该为此更新文档。
推荐阅读
- python - python create csv & Excel open csv问题
- swift - How to retrieve data from Firestore as soon as SwiftUI view appears?
- node.js - 使用 Mongo 每月分组结果
- css - less 是否有 :any() 或 :matches() 或 :is() 填充?
- python - Python算法从列表中近似电阻的最接近并行等效
- asp.net-mvc - ASP Net Core 应用程序回收,因为 ISAPI 报告了不健康的情况
- git - 在 Azure Git 中运行“git archive”会给出错误消息
- c++ - 如何在参数化构造函数中定义 C++ 向量的大小
- python - 正则表达式“减法”方程的匹配模式
- javascript - HTML 和 CSS 我如何做到让每个人都可以看到整个页面而无需缩小