apache-flink - Flink 是否可以对非动态表运行连续查询?
问题描述
我希望将 Flink SQL 用作多个不同服务的物化视图。例如,从 MySQL & Redis & RPC 服务读取数据,将它们连接在一起,然后更新存储在 PostgreSQL 中的结果表
上述所有这些服务都向 Kafka 写入通知,告知发生了什么变化。
如果“通知”包含源表中的所有信息,那么我可以只使用动态表。但是,源表中的数据太大,将它们全部存储在动态表中将是一种浪费。
所以最好的方法是:
- Flink 读取输入 kafka 主题中的通知
- Flink 不是从内存中更新和查询动态表,而是查询外部服务以获取重新计算 SQL 结果所需的数据。
- 将结果写入接收器(如 PostgreSQL)。
是否可以通过一些技巧来做到这一点?
解决方案
似乎是SYSTEM TIME AS OF
/的工作LookupTableSource
;它适用于 JDBC,但不适用于 redis 或 RPC。不过,这应该不太难实现。
推荐阅读
- react-native - 解析 json 在本机平面列表中做出反应
- discord.js - 错误:TypeError:message.guild.channels.find 不是函数
- c++ - 如何从此代码中获取递归调用的数量?
- python - Beautiful Soup 没有返回 html 表的列表
- node.js - 如何从nodejs将数据插入到excel表格的单元格中
- python - 如何在 python 中找到 2 个 3D 矩阵之间的相位相关性?
- android - android中的阿拉伯语翻译问题
- regex - 是否有任何正则表达式可以找到一个值是否是 hashmap?
- php - PHP 警告:preg_match():编译失败:第 223 行 wp-includes/class-wp.php 中偏移量 44 处的字符类范围乱序
- mechanicalturk - Amazon Mechanical Turk:使用网站 UI 创建了一个作业,但想使用 Python API 接受/拒绝作业