首页 > 解决方案 > Pandas:应用带有列和变量作为参数的函数

问题描述

我正在尝试将一个具有多个参数的函数应用于数据框,其中两个需要分配给数据框的行,一个是变量(一个简单的数字)。

类似线程的变体适用于行:(与我的原始函数相比,所有函数都过于简单)

import pandas as pd

dict={'a':[-2,5,4,-6], 'b':[4,4,5,-8]}

df=pd.DataFrame (dict)
print(df)

def DummyFunction (row):
    return row['a']*row['b']
#this works:
df['Dummy1']=df.apply(DummyFunction, axis=1)

但是我如何应用以下变体,我的函数接受一个额外的参数(一个固定变量)?我似乎找不到在 apply 方法中传递它的方法:

def DummyFunction2(row, threshold):
    return row['a']*row['b']*threshold
# where threshold will be assigned to a number?
# I don't seem to find a viable option to fill the row argument below:
# df['Dummy2']=df.apply(DummyFunction2(row,1000), axis=1)

谢谢你的帮助!

标签: pythonpython-3.xpandasdataframeapply

解决方案


您可以将附加变量作为命名参数直接传递给pd.DataFrame.apply

def DummyFunction2(row, threshold):
    return row['a']*row['b']*threshold

df['Dummy2'] = df.apply(DummyFunction2, threshold=2, axis=1)

推荐阅读