首页 > 解决方案 > 将两个数据集加载到 python 中,并希望从第二个数据集中获取一列并放入第一个数据集中

问题描述

[在此处输入图像描述][1][在此处输入图像描述][2]我想将第二个数据集中的一列添加到第一个数据集中。基本上我在 python 中加载了两个数据集,并想从第二个数据集中添加年龄列,并将其作为第一个数据集的列,它没有年龄列。我的最终目标是没有年龄列的第一个数据集,现在拥有第二个数据集具有的年龄列。有没有办法做到这一点?当我尝试使用合并功能时,我的代码出现错误。我应该怎么办?

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
pd.set_option('display.max_columns', 100) #2443 
df= pd.read_csv('genedata.csv')
df

df1=pd.read_csv('traits.csv')
df1

df2= pd.merge(df,df1)

合并错误No common columns to perform merge on. Merge options: left_on=None, right_on=None, left_index=False, right_index=False

标签: pythondataframe

解决方案


简短的回答:

df = pd.read_csv('genedata.csv')

df1 = pd.read_csv('traits.csv')

df['age'] = df1['age_column_from_second_source']

请注意,这假设您的数据帧大小长度相等


推荐阅读