python - 如何从python pandas中的多个excels文件中删除重复记录
问题描述
我每天有 100 多个文件来验证重复行,删除重复记录后必须将所有文件重写到目标文件夹。试图使它为单个文件及其工作,现在每当使用 for 循环读取不。它给我的字典对象不知道如何处理多个文件的文件。我只想将所有文件都写成 excel,因为它将被输入到其他一些程序中。
单个文件的工作代码。
#reading files Source\Studentsheet1.xlsx
df = pd.read_excel('C:\Source\Studentsheet1.xlsx')
#removing duplicates
df1=df.drop_duplicates()
#Now writing file to Target folder
df1.to_excel('C:\target\Studentsheet1.xlsx',columns=['StudentID', 'Class', 'Name', 'Section', Admission_date'],index=False, index_label=None)
样本数据:学生 ID:-SN0001 和 SN0002 是重复行
StudentID Class Name Section Admission_date
Index
1 SN0001 XI Chris A 2017-06-01
2 SN0002 XII Adam B 2016-06-01
3 SN0003 X Justyna A 2018-06-01
4 SN0004 XI Maria B 2017-06-01
5 SN0001 XI Chris A 2017-06-01
6 SN0002 XII Adam B 2016-06-01
解决方案
推荐阅读
- angular - Angular Post API 调用的单元测试
- laravel - 我已经在我的应用程序 .env 中设置了我的域和密码,但我一直无法解析 mailgun 和 laravel 中的错误
- python-3.x - Python,数据框sql连接
- asp.net-core - Asp.net core swagger not found 和服务器错误
- python-3.x - 无法使用 Python SDK 从 Azure 而非公共 Blob 存储下载
- wpf - 文本框不跟随文本,当输入超过适合的内容时
- ios - 在用户更改之前无法从设置包中读取默认值
- excel - 有没有办法根据第一张分组将列值从一张表复制到另一张表作为行
- mongodb - 如何查询嵌套的mongo集合
- c++ - 我想让 + 和 = 符号出现在中间