python - 如何使用 Pandas 构建多核程序?
问题描述
我们希望使用多核并行编程来提高庞大的 Pandas DataFrame 的代码性能。我们想要执行的函数类型有以下几种:单项(如平方函数、对数、倒数、指数)和二进制项(如两个变量的和、两个变量的乘法、两个变量的除法) . 这组函数将应用于原始 DataFrame 中所有可能的变量组合。我们希望在多核范式中执行的功能类型的示例是:
import pandas as pd
data1 = pd.read_csv("data1_path.csv")
data2 = pd.read_csv("data2_path.csv")
def df_square(DF):
aux_DF = pd.DataFrame()
for i in DF.keys():
aux_DF[i + str(**2)] = DF[i]*DF[i]
return aux_DF
def df_sum(DF1, DF2):
aux_DF = pd.Data_Frame()
for i in DF1.keys()
for j in DF2.keys():
aux_DF[i + str(+) + j] = DF1[i] + DF2[j]
return aux_DF
square = df_square(data1)
sum = df_sum(data1, data2)
解决方案
推荐阅读
- python - windows 7、python 3.7 (anaconda)、mayavi、vtk:无法导入 mlab
- ios - 如何防止 SharkORM 中的重复条目
- flutter - 如何显示下一页视图的一部分?
- php - 功能仅适用于第一个按钮。拉拉维尔 7
- apache-spark - spark 2.4 如何安装考拉?
- azure - Grafana / Azure Monitor - 多维过滤
- c# - C#屏蔽或隐藏或删除或编辑pdf文件中的某些区域
- html - 在 laravel 中出现 Http 500 错误
- html - 如何在整个html页面上给出相等的间距
- python - std::endl,在 Python 中是否有等价物?(返回+冲洗)