首页 > 解决方案 > 从 pyspark agg 函数到 int

问题描述

我正在按 pyspark 上的条件计算行数

df.agg(count(when((col("my_value")==0),True))).show()

它按我的预期工作。那么如何提取表中显示的值以存储到 Python 变量中呢?

标签: pyspark

解决方案


如果您只想计算 Trues (ceros),最好这样做:

from pyspark.sql import functions as F
pythonVariable = df.where(F.col('my_value') == 0).collect[0][0]

如您所见,无需将 ceros 更改为 True 即可对其进行计数。


推荐阅读