首页 > 解决方案 > 我正在尝试合并两个 CSV 文件并在 python 中使用 pandas 重新排列它们的列,但是在使用相同的列时遇到问题

问题描述

我在 python 中使用熊猫。

我的两个文件都以相同的“组织”列开头,结果我得到了重复这些组织。与来自每个单独文件的“组织”相关的信息与来自单独文件的组织位于同一行,从而产生许多 NAN 数据空间。我正在尝试删除第一列中的重复项和以下列中的 NAN 数据。

    import pandas as pd

#defining both files
df1 = pd.read_csv('Aaron test 2-CLDN3.csv')
df2 = pd.read_csv('Aaron test 2-CLDN4.csv')


#combining files into one
combined = pd.concat([df1, df2])

#selecting column order
result_df = combined[['Tissue','mean(CLDN3)','mean(CLDN4)','var(CLDN3)','var(CLDN4)']]

print (result_df)

结果

标签: pythonpandasdataframe

解决方案


推荐阅读