apache-kafka - Kafka 连接器的 Presto 查询优化
问题描述
我有一个带有时间戳作为消息键的 kafka 主题,该主题由年月哈希分区。当我尝试使用 Presto 查询 kafka 时,Presto 似乎会获得完整的消息集。我想知道 Presto 的 Kafka 连接器是否会进行分区/偏移相关的优化?例如,如果我按时间戳范围过滤数据,它将转到目标 kafka 分区而无需完整数据扫描。另一个用例是每小时/每天处理的 ETL 作业,Presto 是否可以智能地定位那些数据,例如继续最后的偏移量?
解决方案
推荐阅读
- javascript - Selenium 鼠标滚轮下拉加载所有页面
- c# - Unity如何检测sprite mssing?还是空?
- docker - Docker 容器停止工作并删除所有文件
- spreadsheet - 如何在谷歌电子表格 api 中设置主要维度?
- flutter - Flutter中如何自定义开关让圆圈相对变小?
- python - 捕获列表标签之间的文本并从 BeautifulSoup scrape 打印
- plsql - PL/SQL 如何在存储过程中调用存储函数
- python - deduper.blocker() 函数 - 无法解压不可迭代的 int 对象
- python-3.x - 如何安装 pytesseract?
- sharepoint - AI在什么情况下会计算用户洞察力?