首页 > 解决方案 > 删除数据框中的文本

问题描述

我有下面的数据框df:df:

Description      
sociis natoque (penatibus/magnis)
nec dui nunc mattis enim (ut/tellus/elementum)

我想从描述栏中删除 (penatibus/magnis) 和 (ut/tellus/elementum)

所以我用

df["Description"] = df["Description"].str.replace("(penatibus/magnis)","")

我得到了这个输出:

Description      
sociis natoque ()
nec dui nunc mattis enim ()

我想要的是这个输出:

Description      
sociis natoque
nec dui nunc mattis enim

标签: pythonpandasdataframe

解决方案


使用正则表达式的可行解决方案:

df['Description'] =  [re.sub("[\(\[].*?[\)\]]", "", str(x)) for x in df['Description']]

这将删除(...)or的任何内容[...],包括括号


推荐阅读