首页 > 解决方案 > 我可以在使用 pandas read_csv 导入时将列名全部设为小写吗?

问题描述

我正在解析有效负载,并且只想导入模型中包含的那些列。我可以使用以下方法在熊猫中轻松做到这一点:

df = pd.read_csv(StringIO(values), delimiter=',', usecols=LIST_COLS)

但是,我担心有时列名(通常是驼峰式)与模型中的列名不匹配。因此,在训练我的模型之前,我将所有列名都转换为小写。现在,当我导入我的数据时,我想将列名导入到较低的位置,以确保在连接有效负载的所有部分并且需要生成预测时,一切都将匹配。

我假设这是可能的,但我不知道该怎么做。

先感谢您。

标签: pythonpandas

解决方案


文档_pandas.read_csv

usecols:类似列表或可调用,可选

lambda使用可调用函数修改您的代码如下:

df = pd.read_csv(StringIO(values), delimiter=',', usecols=lambda x: x.lower() in LIST_COLS)

推荐阅读