首页 > 解决方案 > Python将excel文件与不同的非标准列名组合起来

问题描述

如果难以理解,我深表歉意,但出于安全原因,我不允许共享公司代码。主要功能是将多个excel文件(15到20个文件)组合成一个带有标准化单个标题的excel文件,并输出一些描述性统计数据(通常的平均值、最大值、平均值等)

当前文件示例:

File 1
user id | commission | date | amount paid| extra col 1| extra col 2
File 2
comm_amt| user_id | amt_paid | date | extra col 3| extra col 4
File 2
UID | commission_value| transaction_date | value_paid | extra col 5| extra col 6
Ideal output
user_id | commission| transaction_date | value_paid 

因此,当前代码使用 python 字典和键值对列表来帮助确定将哪些列名分配给哪个数据框位置:

dics = {"Date": ['DT_Autralia/East.Day', 'DateCreated', "Event Date", "Action Date","conversion_date", "Transaction Date", 
                 "Booking date","CREATED","Date","date"], .....

我想知道是否有更有效的方法来做到这一点

标签: pythonexcelpandasnumpy

解决方案


推荐阅读