首页 > 解决方案 > 将多列作为参数传递给函数,并从函数中为python中的数据框获取新列

问题描述

我想通过需要两列作为参数的函数的返回值创建一个新列。

这是我的数据框(df)。数据框具有多列索引

时间 温度
ķ 千帕
0.00 300 101
…… …… ……
4.00 380 180

我有一个函数从 Temp and Press 返回一个新值

def density(Temp, Press)
    ....
    return rho

使用此功能,我想创建一个新列,如下所示

时间 温度 密度
ķ 千帕 公斤/立方米
0.00 300 101 1000
…… …… …… ……
4.00 380 180 1004

从我自己的搜索来看,我似乎需要使用“应用”。

所以我尝试了一些代码,例如

df['Density', 'kg/m3'] = df['Density', 'kg/m3'].apply(density, args=(df['Temp', 'K'], df['Press','kPa']))

我收到了错误消息

TypeError:“模块”对象不可调用

QnA,我猜应该修改函数定义以将数据帧类型作为参数。但我被困在这里。

如果我使用另一种方法,例如 for-iteration,它将得到解决。但我希望这个问题有一个更快更简洁的表达方式。

有解决方案吗?

我提前感谢它。=)

标签: pythondataframefunctionarguments

解决方案


下面的代码可以运行很长时间并且无论如何都会产生结果

df['Density', 'kg/m3'] = df.apply(lambda x:density(x['Temp', 'K'], x['Press','kPa']), axis=1)

“数据”很大(ASCII,22 Mb),但我想知道是否有办法加速计算。


推荐阅读