python - 如何提取非结构化的excel文件数据(仪表板数据)并将其导出为结构化的干净数据
问题描述
我有很多 excel 文件,它们在仪表板呈现形式中包含数据,我希望这些数据以结构化方式在 python 中读取,就像 excel 文件中的每一列数据代表熊猫列中的一列数据一样。
import pandas as pd
df=pd.read_excel('claim.xls',index=None,error_bad_lines=False)
df
python中还有其他方法可以获取代码中的所有数据吗?
解决方案
你需要:
- 指定您不会提取的列字母。
- 设置您需要跳过的行数
- 重命名列
import pandas as pd
df = pd.read_excel('claim.xls', skiprows=range(1, 11), usecols = "C,E,G,J,N,R,V,Z,AD,AH,AL,AP,AT")
df.columns = ['Enc. ID', 'Post Date', 'Claim ID', 'Svc. Date', 'Procedure', 'Mod', 'Patient', 'Billed to', 'Adj.Charge', 'Payments', 'Value', 'A/R Balance', 'Age']
输出:
Enc. ID Post Date Claim ID Svc. Date Procedure Mod Patient Billed to Adj.Charge Payments Value A/R Balance Age
0 41083.0 2019-12-12 12:00:00 167189.0 2019-12-11 12:00:00 99204 NaN Smith, Susan L. NOVITAS SOLUTIONS 280.00 - 280.00 280.00 15.0
1 41156.0 2019-12-16 12:00:00 167774.0 2019-12-13 12:00:00 99204 25 Hester, Joyce A. NOVITAS SOLUTIONS 280.00 - 280.00 280.00 13.0
2 41187.0 2019-12-18 12:00:00 169213.0 2019-12-17 12:00:00 99396 NaN RHODA, KATHLEEN M TRICARE PRIME 270.00 - 270.00 270.00 9.0
推荐阅读
- wordpress - 文件上传进度未显示在 WordPress 媒体库(带 CPanel 的 VPS)上
- ios - 自动调整多行标签的自定义文本字段的大小
- python - Pandas - 组织和计算唯一数据
- python - 为什么这个容器不能正常运行?
- ios - 没有收到通知中心观察员 Swift
- jquery - jquery.min.js 错误 500 服务器内部数据表
- regex - 我们可以在不更改源代码的情况下编辑 Spring 验证注解吗?
- r - NULL 不同长度的结果与列表和向量
- scala - 我应该如何从我的自定义 Spark JAR 中登录
- scala - 如何将四个列表组合成Scala中的列表列表