首页 > 解决方案 > 有没有办法根据列名修改 Pandas 数据框中的列值?

问题描述

需要对来自导入的 Excel 电子表格选项卡的 Pandas 数据框在同一选项卡上具有多种表格格式进行操作以转换值以添加标签并将值包含在括号中 - 例如,“Denver”可以在 CITY 列中变为“METRO(Denver)”。

我可以使用下面的方法导入电子表格选项卡,但找不到找到不同列和转换值的解决方案。

import pandas as pd
xls_file = pd.ExcelFile(r"C:\Users\Excel Work Request - Intake Form.xlsx")
table = xls_file.parse('Demographics Input')

excel中的数据格式如下:

>1  Note to user
>2  Note line 2
>3  Line 3
>4  Line 4: Line4-value
>5  Account name xyz
>6
>.
>.
>.
>13 TABLE1
>14 Table1-header-row [14 column headers]
>15 Blank line
>16 n1 rows of Table1-values [14 column values ]
>   <variable blank rows/lines>
>   TABLE2
>   Table2-header-row [ 13 column headers ]
>   n2 rows of Table2-table-values [ 13 column values ]
>   <some blank rows/lines>
>   TABLE3
>   Table3-header-row [ 11 column headers ]
>   n3 rows of Table3-table-values [ 11 column values ]
>   <variable blank rows/lines>
>   TABLE4
>   Table4-header-row [ 6 column headers ]
>   n4 rows of Table4-table-values [ 6 column values ]
>   <variable blank rows/lines> 
>   < some information not used in processing >

要求是能够访问表 1-4 中不同格式的列中的值(同一选项卡上的多个表格式),识别每种类型的列并应用一些规则进行转换。我正在查看 df.loc 但由于我对 Pandas 没有太多经验,无法确定解决方案。

标签: excelpython-3.xpandas

解决方案


推荐阅读