首页 > 解决方案 > 基于另一个 DataFrame 的 DataFrame 的新列

问题描述

我想将“文本”列与 B 值最接近 <= A 值的第一个 DataFrame 结合起来。DataFrames 长度不相等。

例子

a = np.array(range(10, 35, 5))
b = np.array(range(0, 30, 5)) + 2
b_text = [random.choice(string.ascii_letters) for i in range(len(b))]
df1 = pd.DataFrame(a, columns=['A'])
df2 = pd.DataFrame(list(zip(b, b_text)), columns=['B', 'text'])

标签: pythonpandasdataframe

解决方案


我认为需要merge_asof

#if problem with different dtypes
#df1['A'] = df1['A'].astype(np.int64)
#df2['B'] = df2['B'].astype(np.int64)

df = pd.merge_asof(df1, df2, left_on='A', right_on='B')
print (df)
    A   B text
0  10   7    R
1  15  12    y
2  20  17    i
3  25  22    a
4  30  27    G

推荐阅读