首页 > 解决方案 > 用逗号、引号和引号替换不按预期工作

问题描述

我有一个数据框火车,它有逗号、引号等字符。所以我尝试将它们替换如下,

train['content']=train['content'].replace('…','')
train['content']=train['content'].replace('”','')
train['content']=train['content'].replace('“','')
train['content']=train['content'].replace('’','')

但是,即使在替换它们之后,我仍然会得到字符。内容没有变化。,并且仍然存在commasinverted commas...

我的火车数据框中有 30,000 行。我希望从所有 30,000 行中替换上述字符

编辑: 火车

content
[sure, tune, …, watch, donald, trump, “,”, late, ’ , night]
[abc, xyz, “,”,late, ’, night]

基本上内容列是一个列表

标签: pythonpandas

解决方案


您可以将其转换为列表,它们使用列表推导:

train['content'] = [i for a in ['…','”','“','’'] for i in train['content'].tolist() if a not in i]

更新:

train['content'] = [i if a not in i else None for a in ['…','”','“','’'] for i in train['content'].tolist()]

或者:

train['content'] = pd.Series([i for a in ['…','”','“','’'] for i in train['content'].tolist() if a not in i])

推荐阅读