python - 删除数据框中的文本
问题描述
我有下面的数据框df:df:
Description
sociis natoque (penatibus/magnis)
nec dui nunc mattis enim (ut/tellus/elementum)
我想从描述栏中删除 (penatibus/magnis) 和 (ut/tellus/elementum)
所以我用
df["Description"] = df["Description"].str.replace("(penatibus/magnis)","")
我得到了这个输出:
Description
sociis natoque ()
nec dui nunc mattis enim ()
我想要的是这个输出:
Description
sociis natoque
nec dui nunc mattis enim
解决方案
使用正则表达式的可行解决方案:
df['Description'] = [re.sub("[\(\[].*?[\)\]]", "", str(x)) for x in df['Description']]
这将删除(...)
or的任何内容[...]
,包括括号
推荐阅读
- c# - Entity Framework Core Database 首先不渲染存储过程的模型?
- flutter - 如何在 url_launcher 中打开 Gmail 应用程序(不创建电子邮件只是打开收件箱)?
- flutter - 如何像这样在颤动中做数据
- kubernetes - 在不同主机上使用复制容器安排作业
- javascript - d3 为选择获取数据绑定有效,但是当我迭代选择时,它不起作用
- machine-learning - CatBoost 机器学习超参数:为什么不总是使用 `thread_count = -1`?
- python-3.x - 使用 PRAW 时出现 401 状态错误(reddit)
- python - 用于查找最大值的列的动态连接
- git - 前面的正则表达式 git secret 无效
- swift - 如何在 Firebase 动态链接 iOS Swift 中添加 OFL 链接?