首页 > 解决方案 > 我有一个 Excel 表,其中包含一些页眉和页脚以及数据,现在我想在其间编辑该数据框的一列

问题描述

我有一个 Excel 表,其中包含一些页眉和页脚以及数据,现在我想在其间编辑该数据框的一列,这样我就不想更改任何其他内容。正如您在链接和照片中看到的那一列是贷款编号。例如在给定的数据集中,我想更改贷款编号。从第 6 行到 xyzzz 从 abcd|xyzzz 并且不想更改除此之外的任何内容并将文件保存回 excel 格式。

在 pd.read_excel 中读取文件时,它会格式化一些数据(弄乱列、未命名等),我还应该如何在 python 中执行此操作?

PS-最后还有一行页脚 https://drive.google.com/file/d/1gJ97HpG3OJlrcQswI2BIWLsZluza4PEm/view?usp=drivesdk

这是数据集的链接

这是屏幕截图

标签: pythonpandasnumpyxlsxwriterpandas.excelwriter

解决方案


你可以试试这样的

import pandas as pd
import xlrd
# pip install openpyxl
df = pd.read_excel('./sample23.xlsx', 'Sheet0', header=None)
def change(x):    
    try:
        if x != 'abcd|xyzzz' and x == 'Loan No.':
            return x
        elif x == 'abcd|xyzzz':
            return 'xyzzz' 
    except Exception as e:
        return x


df[6] = df.apply(lambda row: change(row[6]), axis=1)
df.to_excel("test.xlsx",sheet_name='Sheet0', header=None, index=None)

df.head(10)

推荐阅读