首页 > 解决方案 > 在 Spark Dataframe 中选择一系列列

问题描述

假设我有一个 Spark Dataframe df,我如何选择一系列列,例如从第 100 列到第 200 列?

标签: pythonapache-sparkpyspark

解决方案


由于df.columns返回 a list,您可以对其进行切片并将其传递给select

df.select(df.columns[99:200])

这将获得DataFrame包含第 100 到第 200 列的子集,包括在内。


推荐阅读