pyspark - 如何将数据框的所有列设置为空值
问题描述
我有一个数据框,它有 n 个包含所有数据类型的列我想要一个具有相同数量的列/列名的空数据框在创建列之后;有什么办法可以将列值设置为空
解决方案
您可以通过以下方式实现它。
from pyspark.sql import SparkSession
from pyspark.sql import functions as F
spark = SparkSession.builder \
.appName('stackoverflow')\
.getOrCreate()
sc= spark.sparkContext
df1 = sc.parallelize([
(1, 2, 3), (3,2, 4), (5,6, 7)
]).toDF(["a", "b", "c"])
df1.show()
+---+---+---+
| a| b| c|
+---+---+---+
| 1| 2| 3|
| 3| 2| 4|
| 5| 6| 7|
+---+---+---+
df2 = df1.select( *[F.lit(None).alias(col) for col in df1.columns])
df2.show()
+----+----+----+
| a| b| c|
+----+----+----+
|null|null|null|
|null|null|null|
|null|null|null|
+----+----+----+
推荐阅读
- javascript - javascript for 循环更改原始列表变量
- excel - 按日期顺序对列中的前 n 个非空值求和并在 X 行停止
- r - shinyloadtest 库无法访问闪亮的应用程序
- android - 是否可以为 ViewModelProvider.Factory 创建一个带有 T 参数的基本构造函数?
- python - SQLAlchemy 排序列集合
- vue.js - 在提供 dist 后,单击 Header 中的路由使用 prerender-spa 插件刷新 vuejs 中的页面
- multidimensional-array - 如何编写一个将 ndarray Array 或 ArrayView 作为输入的通用函数?
- python-3.x - 如何停止特定的线程?
- python - 在 Python 中使用字符串格式添加空格
- java - FileWritter 将整数写入为非法字符