python - 如何在 Python Regex Dataframe 中删除多种特殊字符模式
问题描述
所以我有一个名为的数据框usa_sub_states
,其中有一列名为'state'
.
在 的列中state
有 5 个状态为非字母字符串。
Massachusetts[C]
Pennsylvania[C]
Rhode Island[D]
Virginia[C]
Hawai'i
现在我想知道是否有一种方法可以用空字符串替换所有特殊字符,以便它们都作为常规状态名称出现。
usa_sub_states.state.replace(to_replace=r'[\W]', value='', regex=True, inplace=True)
但由于某种原因,这删除了该列的所有内容并使其成为空字符串。
解决方案
您可以使用
usa_sub_states.state.replace(to_replace=r'\[[^][]*]|\W', value='', regex=True, inplace=True)
请参阅正则表达式演示。详情:
\[[^][]*]
- ,然后是除and[
之外的任何零个或多个字符[
]
|
- 或者\W
- 任何非单词字符。
推荐阅读
- arrays - 如何组合字典中的重复键并快速总结值?
- android - 用于测试 SafetyNet 验证应用 API 的潜在有害应用程序示例
- javascript - 获取数据时单选按钮的Reactjs问题
- ruby-on-rails - 可以在加载 Rails 之前进行测试吗?
- android - 带有手势导航的错误小吃店位置
- image - 如何在python中保存没有框架的图像?
- node.js - 来自 lambda 的第一个请求未插入 DynamoDB 项目需要发出 4-5 个请求
- asp.net - 购物车 ASP.NET MVC 的数量
- html - 响应 DIV 大小的字体大小
- ios - 在 xamarin 表单中从 ViewModel 加载 Listview 中的更多项目