apache-spark - Spark:如何读取镶木地板
问题描述
一个问题是为了了解 spark 是如何工作的。当您使用:
spark.read.parquet(sourcePath).{transformation}.{action}
如何读取镶木地板文件?它是在驱动程序上完成,然后分派给每个执行者吗?还是每个文件都发送给负责读取的执行程序?
如果 parquet 被快速压缩,解压缩在哪里以及如何完成?
我想知道镶木地板文件在被读取后是否会留在驱动程序内存中。
解决方案
推荐阅读
- angular - 在 Nx 可发布库中编译和包含 SCSS 的问题
- text - 文本格式菜单的名称
- c++ - 在 C++ 中跟踪类实例化的概念
- webpack - Webpack:将 javascript 包名称注入 JSP 或 Apache Velocity 等服务器模板
- bash - 如何检测 BASH 中的 TAB 键?
- angular - 路由问题:Angular 在加载新选项卡时不断重定向到主页
- fullcalendar - 在资源时间线/调度器上选择多个事件
- vb.net - 无法将完整字符串传递给委托
- matlab - “imshowpair”八度的matlab函数替代
- java - 线程“AWT-EventQueue-0”中的异常 java.lang.NoClassDefFoundError: UI/ChartsFrame