python - 将 Pandas 数据框传递给 python 中的函数
问题描述
我需要对多个数据框进行大量数据处理。而不是写很多行来对它们做同样的事情。我希望您将它们传递给函数或使用装饰器或任何其他有效的替代方法。鉴于熊猫数据框是全球性的,我正在寻找有关此类任务的有效方法的评论。
我的问题如下所示:
import pandas as pd
def data_extraction():
#Here will fetch data from mongodb"
df1 = pd.DataFrame(X1)
.
.
df10= pd.DataFrame(X2)
##These 10 data frames have data corresponding to students in 10 different school
做一些数据整理以使数据框可用
def cleanup(df):
df.describe()
####Here I basically want to add some functionality to vary sampling fraction based on population
df_pruned=df.sample(frac=0.2))
return df_pruned
# Apply some machine learning
def ML(df):
#import pymrmr
pymrmr.mRMR(df, 'MIQ',6)
.
if __name__ == "__main__":
df1.......df10 = data_extraction()
df_pruned_1 =cleanup(df1)
解决方案
推荐阅读
- java - 从特定单词读取文本文件以从 Java 中的特定单词停止
- ruby-on-rails - 如何将选项传递给heroku中的rails控制台
- php - 如何在 Laravel 中进行多数据库查询?
- python - 在 python sqlite3 中创建临时数据库的目的是什么?
- jaeger - Jaeger - 运行 jaeger 需要多少存储空间?
- angular - 为什么主题有时会发出数据?
- c++ - 关于 C++ 构造函数
- arrays - Flutter:如何存储或保存用户点击的按钮的值?
- swift - 如何在swift中根据项目数计算高度
- c# - TextWriter 不工作,因为它被另一个进程使用。网络5.0