apache-spark - Spark DataSet Join 是否过滤下推
问题描述
我是 Spark DataSet/RDD/DataFrame 概念的新手,主要使用 SparkSQL。
我有如下查询,不通过 SQL 直接操作数据:
Dataset<Row> result =
tableA.join(tableB,
expr("x = y AND " +
"timestamp >= timestampConstant AND " +
"timestamp <= timestampConstant + INTERVAL " + timestampDiff));
上述 DataSet 连接是否会自动将范围过滤器 ( ) 下推timestamp
到表扫描的一侧?或者我应该手动重写上面的代码来下推范围过滤器然后进行连接?
感谢您的回答。
解决方案
推荐阅读
- wdk - 如何在 WDK 中同时处理 winnt.h 和 ntstatus.h?
- docker - Traefik + Consul 不使用 TRAEFIK DEFAULT CERT 在复制模式下生成 SSL 证书
- python - 查找文件中的所有 url
- java - 自动从appium获取设备参数
- python - Flask + Sqlite3 不正确的字符串格式
- javascript - 有没有办法在 React js 中改变渲染内部的状态?
- c# - 为什么重新加载页面时通过 StreamWriter 写入文件的文本不会保存?(Xamarin)
- algorithm - 如何就地重新排列一维矩阵数组中的元素?
- java - 每当我添加新片段或 java 文件时,Android Studio 都会显示错误
- c# - 配置 IIS Express 以允许使用公共 ip 的请求