python - Pandas:应用带有列和变量作为参数的函数
问题描述
我正在尝试将一个具有多个参数的函数应用于数据框,其中两个需要分配给数据框的行,一个是变量(一个简单的数字)。
类似线程的变体适用于行:(与我的原始函数相比,所有函数都过于简单)
import pandas as pd
dict={'a':[-2,5,4,-6], 'b':[4,4,5,-8]}
df=pd.DataFrame (dict)
print(df)
def DummyFunction (row):
return row['a']*row['b']
#this works:
df['Dummy1']=df.apply(DummyFunction, axis=1)
但是我如何应用以下变体,我的函数接受一个额外的参数(一个固定变量)?我似乎找不到在 apply 方法中传递它的方法:
def DummyFunction2(row, threshold):
return row['a']*row['b']*threshold
# where threshold will be assigned to a number?
# I don't seem to find a viable option to fill the row argument below:
# df['Dummy2']=df.apply(DummyFunction2(row,1000), axis=1)
谢谢你的帮助!
解决方案
您可以将附加变量作为命名参数直接传递给pd.DataFrame.apply
:
def DummyFunction2(row, threshold):
return row['a']*row['b']*threshold
df['Dummy2'] = df.apply(DummyFunction2, threshold=2, axis=1)