首页 > 解决方案 > 以有效的方式自定义正则表达式查询

问题描述

所以,我有一个简单的疑问,但我是正则表达式的新手。我正在使用 Pandas DataFrame。其中一列包含名称。但是,有些名字写成“John Doe”,但有些名字写成“John.Doe”,我需要把它们都写成“John Doe”。我需要在整个数据帧上运行它。什么是正则表达式查询以有效地解决此问题。列名称 = 'Customer_Name'。让我知道是否需要更多详细信息。

标签: pythonregexpandassplitdata-cleaning

解决方案


尝试运行它来替换所有 . 有空间,如果这是你唯一的条件:

df['Customer_Name'] = df['Customer_Name'].str.replace('.', ' ')

推荐阅读