python - 数据框值的正则表达式
问题描述
def Clean_Data(df):
df.replace({ r'\A\s+|\s+\Z': '', '\n' : ' ', '\w\s+\w|\w\n\w': '\w\s\w'}, regex=True, inplace=True)
return df
我想在处理之前清理我的数据框。我需要摆脱:
双空格
空格 + 换行符
-> 并将其替换为单个空格。
我还想检查两个单词(字母或数字)之间是否有多个空格并将其减少为一个空格。
并且至少检查单词和符号(或。)之间是否有空格并替换为''。
但我实际上不知道正则表达式并且已经得到了一个错误bad escape \w
解决方案
试试这个
df.replace({' +':' ', '\n':' ','->':' '}, regex=True, inplace=True)
第一个检查多个空格并仅替换为一个空格。
第二个检查新行并用空格替换
第三个是模式 -> 并用空格替换
推荐阅读
- java - 是否可以像在 Java 中一样访问 C++ 中的静态成员类?
- reactjs - 如何在同一页面上同步两个分页组件
- twilio - Twilio Studio 拨出电话
- elasticsearch - 在 Elasticsearch 中克隆和重新索引索引有什么区别?
- javascript - 在 React 中 useEffect 在值从其他组件更改后不会更新
- javascript - 从 node-red 发送数据到本地网页
- git - 过滤 git repo 以从历史记录中删除大文件。工作副本成功,但推送后未显示在远程仓库中
- jquery - 从 jquery 在views.py 中起作用的URL
- sql - 如何在没有 RawSQL 的情况下在 Django 中创建和访问正则表达式捕获组?
- tensorflow - ValueError:检查输入时出错:预期 dense_1_input 具有 3 个维度,但得到的数组形状为 (5, 1)