pyspark - 错误:类型错误 when() 在 PySpark 中缺少 1 个必需的位置参数“值”
问题描述
使用 Pyspark 在数据块中运行数据帧时出现上述错误。我不知道如何解决这个问题以及我哪里出错了。代码如下:
df_inner_select = df_promodata_daypart.select(df_promodata_daypart.sub_master_id,df_promodata_daypart.sub_campaign_id,df_promodata_daypart.resolved_network,df_promodata_daypart.hh_id,df_promodata_daypart.type,df_df_promodata_daypart.localpromoadviewstarttime_min).alias("viewerbytype").groupby(df_promodata_daypart.sub_master_id,df_promodata_daypart.sub_campaign_id,df_promodata_daypart.resolved_network,df_promodata_daypart.hh_id,df_promodata_daypart.localpromoadviewstarttime_min).agg(F.sum(F.when(df_promodata_daypart.type=="NonTargeted",1).otherwise(0).alias("NonTargeted_count")),F.sum(F.when(df_promodata_daypart.type=="Targeted").alias("Targeted_count")))
而且在这里我需要获取数据框中提到的类型列的计数。谁能帮助我尽快解决这个问题?
提前非常感谢。
解决方案
推荐阅读
- javascript - 使用 Google Assistant 进行视觉选择响应,列表不起作用?
- visual-studio-code - 是否有基于 VSCode 开源基础构建的应用程序?
- python - 计算由另一列分组的多对列之间的变化百分比
- javascript - 将导航和道具传递给反应本机组件时未定义的功能(基本断开按钮)
- typescript - typescript“接口|接口|函数”语法是什么意思?
- graph - 如何在 Power BI 中显示实际值而不是总和/平均值/计数?
- flutter - 如何将 Hive 对象(HiveList)列表存储/更新为 Hive 对象
- go - 扫描到 gorm 查询的结构
- typescript - 错误:找不到模块'@vue/cli-plugin-babel/preset'
- xml - 使用 Dart 修改 XML 文件