首页 > 解决方案 > 熊猫替换不匹配的子字符串

问题描述

我正在尝试删除熊猫数据框中的一些子字符串。但是,即使在regex=True

我的数据框开始为:

0                     0                @VirginAmerica What @dhepburn said.
3                    -1  @VirginAmerica it's really aggressive to blast...
4                    -1  @VirginAmerica and it's a really big bad thing...

如果我尝试这条线df = df.replace(r'@VirginAmerica', '', regex=True),它似乎没有效果。但是,如果我尝试匹配整行,例如df = df.replace(r'@VirginAmerica What @dhepburn said.', '', regex=True)它会导致:

0                     0                                                   
3                    -1  @VirginAmerica it's really aggressive to blast...
4                    -1  @VirginAmerica and it's a really big bad thing...

有什么方法可以尝试,或者我错过了什么,让它匹配子字符串?

标签: pythonpandasdataframe

解决方案


由于您尝试替换的子字符串位于每个字符串的开头,因此我建议您尝试如下完成您的语句(就在@之前):

df = df.replace(r'^@VirginAmerica', '', regex=True)


推荐阅读