首页 > 解决方案 > 将 Pandas 数据框传递给 python 中的函数

问题描述

我需要对多个数据框进行大量数据处理。而不是写很多行来对它们做同样的事情。我希望您将它们传递给函数或使用装饰器或任何其他有效的替代方法。鉴于熊猫数据框是全球性的,我正在寻找有关此类任务的有效方法的评论。

我的问题如下所示:

import pandas as pd

def data_extraction():
#Here will fetch data from mongodb"
     df1 = pd.DataFrame(X1)
     .
     .
     df10= pd.DataFrame(X2)
##These 10 data frames have data corresponding to students in 10 different school

做一些数据整理以使数据框可用

    def cleanup(df):    
        df.describe()
####Here I basically want to add some functionality to vary sampling fraction based on population
        df_pruned=df.sample(frac=0.2))
    return df_pruned

# Apply some machine learning
def ML(df):
#import pymrmr
     pymrmr.mRMR(df, 'MIQ',6)
     .

if __name__ == "__main__":
     df1.......df10 = data_extraction()
     df_pruned_1 =cleanup(df1)

标签: pythonpandas

解决方案


推荐阅读