pyspark - 如何在pyspark中使用reduce动态填充?
问题描述
我已经创建了这个函数来根据输入参数将 fillna 应用到数据帧,但它似乎覆盖了最后一个参数,例如这里丢失的参数,而不是第一个参数的输出。
这是我的功能:
def fillna(df, params):
return reduce(
lambda data, rules: data.fillna(rules[0], subset=rules[1]), params.items(), df,
)
where df: input dataframe
params={0:['age'], Missing: ['name']} #
input :
id age name
1 12 tan
2 saks
3 23
output:
id age name
1 12 tan
2 0 saks
3 23 missing
解决方案
推荐阅读
- twilio - 通过 SMS 自动化发送唯一代码
- android - android studio 应用程序文件夹丢失。如何再次显示?
- asp.net-core - 如何对 Azure AD 中特定区域的用户进行身份验证和授权?
- mysql - 在 MySQL 源上启用 CDC 时,AWS DMS“不支持或注释掉 DDL”
- database - 基于名称类别在 ms 访问中创建新列
- c - 矩阵乘法函数不会在主函数内编译
- python - matplotlib.pyplot 不显示图形?
- javascript - 如何将对象映射到所有输入元素?
- python - Python Tkinter 循环使用每个新列表值更新 3 个标签
- php - 检查结帐页面,如果登录用户已经购买了产品