count - Pyspark 中计数的别名
问题描述
我是 Pyspark 的新手。我正在尝试将别名用于计数功能。出于某种原因,如果我agg
在前面使用count
thenalias
是有效的,但如果我没有聚合,那么这alias
会给我错误。
.(count("firstName").alias("cnt"))
不工作;
.agg(count("firstName").alias("cnt"))
作品。
我想了解第一个查询的问题。
解决方案
你可以试试这个:
.count().withColumnRenamed("count","cnt")
我们不能直接给计数函数起别名
推荐阅读
- arrays - 包含多边形点的数组。我们可以遍历它的边界吗?
- r - 从 R 到 Excel 显示特殊字符(带圆圈的字母)或 unicode
- excel - VBA 中的对象分组
- r - 数据整理:重塑
- angular - 我不能在角度 6 的箭头上使用 ngif
- spring - 如何使用 spring Webflux 和 dynamodb 构建反应式 api?
- angular - 错误:未捕获的承诺:无效链接:EditPage
- ruby-on-rails - 无法将记录保存/更新到 rails 中的 db
- c++ - 读取输入的字符串行并将其中的数字用作c ++中的整数
- java - 使用 kafka 触发流式传输 一位消费者正在读取数据