首页 > 解决方案 > 如何有效地改变熊猫数据框的值

问题描述

假设我有 2 个数据框。

首先

100K rows
columns: ID, ch1,ch2...ch10,
binary values

第二

1000K rows
columns: ID, CH.

假设我想将 DF1 的值添加到 DF2,在 1 列中,它将适合 ID&chan。

我尝试用一​​个简单的 for 循环来完成它,但花了几分钟才超过前 10K 行。我想知道如何有效地完成它 - 就好像我用 numpy 完成它一样,它会工作快点。只是为了澄清一下,ID 可以在 DF2 中洗牌。所以我无法根据 DF1 预测它的位置。

提前致谢!

标签: pythonpandas

解决方案


更新帖子:

啊好吧。我想我明白你在说什么。也许尝试这样的事情:

df1 = pd.DataFrame({ "ID":[1,2,3], "ch1":[0,-1,0], "ch2":[0,0,0], "ch3":[-1,0,1] })

new_df = pd.DataFrame()

min_ch = 1
max_ch = 3
for i in range(min_ch,max_ch+1):
    this_ch_str = "ch"+str(i)
    temp_df = df1[["ID",this_ch_str]].copy()
    temp_df["CH"] = i
    temp_df = temp_df.rename(columns={this_ch_str:"val"})
    temp_df = temp_df[["CH","ID","val"]]
    new_df = new_df.append(temp_df)

这有点令人费解,但它完成了工作。

原帖:

我认为“合并”功能可能是您正在寻找的。

这是一个简单的例子:

import pandas as pd
df1 = pd.DataFrame({"ID":[1,2,3,4,5],"col1":["A","B","C","D","E"]})
df2 = pd.DataFrame({"ID":[1,2,3,4,5,6,7,8,9,10],"col2":["x","y","z","x","y","z","x","y","z","x"]})
df3 = pd.merge(left=df1,right=df2,on="ID",how="left")

存储在 df3 中的结果如下所示:

   ID col1 col2
0   1    A    x
1   2    B    y
2   3    C    z
3   4    D    x
4   5    E    y

希望这就是你要找的!


推荐阅读