python - 如何访问 Pandas 中的重复列
问题描述
我在 excel 文件中有以下数据,列同名。
Parts Tanning Tanning Tanning
A 23 46 46
B 32 35 48
如何访问 Tanning 第 2 列或第 3 列的数据?不使用列索引号,而仅使用标题。有没有办法不实际重命名标题?
我目前正在使用列索引号,但文件越来越大。
解决方案
但是在使用 read_excel 读取文件时,您可以将参数传递mangle_dupe_cols
为 True(默认情况下为 False,默认情况下 pandas 删除重复列)
pd.read_excel('tmp.xlsx', mangle_dupe_cols=True)
它会自动命名带有前缀的重复列<colname>.n
(n 是该列的重复项)为
Tanning.0,Tanning.1,Tanning.2, ....
现在您可以通过输入前缀来访问它们 .n
,其中 n 是前缀的重复名称计数Tanning
df['Tanning.2']
推荐阅读
- sockets - 使用 C# 为绑定套接字创建连接和断开的回调?
- docker - docker nginx,退出代码 139
- webpack - Webpack babel 仅返回 > 250kb 的开发大文件
- javascript - .join 在 JavaScript 中是什么意思?
- php - 用户在线列表 PHP
- linux - 删除Linux中文件中两个位置之间具有特定字符的所有行
- javascript - Visual Studio 2019 不会使用 webpack-source 构建 TypeScript
- python - 无法使用请求库获得正确的响应页面
- asp.net - Ajax Control Toolkit 在 Visual Studio 中有效,但在网站上无效
- mysql - 从旧数据库迁移数据,然后将其导入新数据库