首页 > 解决方案 > 如何使用python根据通用标识符合并2个excel电子表格?

问题描述

我正在尝试根据唯一标识符将两个数据集合并为一个。在一个电子表格中,我有一份患者名单和一些信息,例如入院日期。另一方面,我有一份他们收到的药物清单,以及医院的单位等。每个都有一个唯一的医疗标识符,将它们联系在一起。如何使用 python 将所有给予患者的药物添加到主电子表格中,理想情况下在标记为“药物”的列中?

我尝试了以下方法,但它没有将它们放入单独的列中,而且它处理日期的方式似乎没有模式。相反,它创建了患者的多个副本。它似乎还没有复制到两个原始文件中都不存在的任何患者。

import pandas as pd
%pylab inline

drug_df = pd.read_excel(
    'C:/Users/Documents/Antibiotic Data.xls',
    parse_dates=[7, 8, 11, 17, 18],
    infer_datetime_format=True)
main_df = pd.read_excel(
    'C:/Users/Documents/Main Data.xls'
    parse_dates = [2, 3, 4],
    infer_datetime_format = True)
merged = drug_df.merge(main_df, on="MRN")
merged.to_csv("merged.csv", index=False)

这是一些非常基本的电子表格的链接,它应该让您了解我开始和结束的内容。

https://1drv.ms/f/s!ApoCMYBhswHzhokWfC6UILHhEqV_eA

任何提示如何从这里继续前进?

谢谢,

卡勒姆

标签: pythonexcelpandasmerge

解决方案


推荐阅读