python-3.x - 如何从python中数据框中的所有工作表中删除重复项
问题描述
我有一个包含工作表数量的数据框,我想从所有工作表中删除重复项。我在下面的代码中使用
df = df.drop_duplicates(subset='Month',keep='last')
之后我保存这个df
df.to_excel(path,index=False)
但是它只删除了第一张重复的纸并且只显示了一张
解决方案
我建议将文档的每张纸视为一个单独的数据框,然后在迭代中根据您的标准删除每组的重复项。这是我想到的概念的快速草稿,共 2 张:
xls = pd.ExcelFile('myFile.xls')
xls_dfs = []
df1 = pd.read_excel(xls, 'Sheet1')
xls_dfs.append(df1)
df2 = pd.read_excel(xls, 'Sheet2')
xls_dfs.append(df2)
for df in xls_dfs:
df = df.drop_duplicates(subset='Month',keep='last')
df.to_excel('myFile.xls',index=False)
推荐阅读
- ubuntu-18.04 - 在 ubuntu 18.04 上降级 glibc
- java - RecyclerView调用onCreateViewHolder,getItemCount()>0,但是onBindViewHolder没有被调用
- typescript - 通用数据库抽象的正确类型
- qt - 在图层上方添加元素
- sql - Node.js 和 PostgreSQL 加入过程
- nix - 如何防止 nix-build 替换源文件中的路径?
- javascript - 如何按年龄值对该数组进行排序?
- c# - 通过 QT 使用 .NET dll
- haskell - ghc-pkg:无法打开数据库进行修改:hLock:无效参数
- php - preg_replace 和 preg_match 不返回任何结果,即使正则表达式有效