pyspark - 从 pyspark agg 函数到 int
问题描述
我正在按 pyspark 上的条件计算行数
df.agg(count(when((col("my_value")==0),True))).show()
它按我的预期工作。那么如何提取表中显示的值以存储到 Python 变量中呢?
解决方案
如果您只想计算 Trues (ceros),最好这样做:
from pyspark.sql import functions as F
pythonVariable = df.where(F.col('my_value') == 0).collect[0][0]
如您所见,无需将 ceros 更改为 True 即可对其进行计数。
推荐阅读
- hyperledger-fabric - 添加新组织时,是否需要应用锚点?
- swift - 如何从不同的视图控制器访问引用插座?
- javascript - 如何使用 JS/Jquery 将 div 覆盖在其他 2 个 div 上
- html - 在 Swift 4 中将属性文本转换为 HTML
- excel - '>>' 附近的语法不正确。Excel VBA 读取带有有趣前导字符的 .SQL 文件(即  从测试中选择前 100 个 *)。编码问题
- c# - 有没有一种“简单的方法”来创建一个队列,在一定时间后,它会出队?(C#)
- .htaccess - 为什么这个漂亮的 url .htaccess 不起作用?
- android - 如何在 Android 中收听外部键盘按键?
- android - 向 RecyclerView 传递多个参数
- c - 双自动修圆