首页 > 解决方案 > Spark中的动态过滤

问题描述

我想了解动态过滤的工作原理。我所知道的是,假设有 2 个表 A(百万行)和 B(10k 行)。现在,如果在 B 上应用谓词,则在 A 和 B 之间执行连接时,然后通过动态过滤,我们可以避免对 A 进行全扫描。这有助于减少混洗的数据。我的问题是:

标签: apache-sparkapache-spark-sql

解决方案


推荐阅读