首页 > 解决方案 > 使用 pyspark 动态编写镶木地板

问题描述

有没有办法使用pyspark在dataframe.write上动态调整parquet输出文件的大小?我们有一个通用的工作,将许多表写入 S3,其中一些很小,但有些非常大。如何使用一项工作为所有人调整输出的大小?

标签: pysparkparquet

解决方案


推荐阅读