首页 > 解决方案 > Python Pandas:数据框不使用字符串方法更新

问题描述

我正在尝试更新.csv我正在使用 Pandas 读取的文件中的字符串。包含列.csv名“关于”,其中包含我要操作的数据行。

我已经用过 str 了。更新,但它没有反映在导出的.csv文件中。我的一些代码可以在下面看到。

import pandas as pd

df = pd.read_csv('data.csv')
df.About.str.lower() #About is the column I am trying to update
df.About.str.replace('[^a-zA-Z ]', '')
df.to_csv('newdata.csv')

标签: pythonpandasdataframe

解决方案


示例数据框

>>> df
        About
0      JOHN23
1     PINKO22
2   MERRY jen
3  Soojan San
4      Remo55

解决方案:,另一种方式使用带有标志的已编译正则表达式

>>> df.About.str.lower().str.replace(regex_pat,  '')
0          john
1         pinko
2     merry jen
3    soojan san
4          remo
Name: About, dtype: object

解释:

匹配下面列表中不存在的单个字符[^a-z]+

+量词 - 匹配一次和无限次,尽可能多次,根据需要(贪婪)返回 a(索引 97)和 z(索引 122)之间范围内的单个字符(区分大小写)

$在行尾断言位置


推荐阅读