python - 用逗号、引号和引号替换不按预期工作
问题描述
我有一个数据框火车,它有逗号、引号等字符。所以我尝试将它们替换如下,
train['content']=train['content'].replace('…','')
train['content']=train['content'].replace('”','')
train['content']=train['content'].replace('“','')
train['content']=train['content'].replace('’','')
但是,即使在替换它们之后,我仍然会得到字符。内容没有变化。,并且仍然存在commas
。inverted commas
...
我的火车数据框中有 30,000 行。我希望从所有 30,000 行中替换上述字符
编辑: 火车
content
[sure, tune, …, watch, donald, trump, “,”, late, ’ , night]
[abc, xyz, “,”,late, ’, night]
基本上内容列是一个列表
解决方案
您可以将其转换为列表,它们使用列表推导:
train['content'] = [i for a in ['…','”','“','’'] for i in train['content'].tolist() if a not in i]
更新:
train['content'] = [i if a not in i else None for a in ['…','”','“','’'] for i in train['content'].tolist()]
或者:
train['content'] = pd.Series([i for a in ['…','”','“','’'] for i in train['content'].tolist() if a not in i])
推荐阅读
- oop - 通过 UUID 存储对象的模式名称
- r - 如何将 Shiny 的输入结果插入到 mySQL where 子句?
- prolog - 列表中的相同元素
- javascript - PHP echo Javascript函数不做任何事情
- java - 主数据源中没有名为“entityManagerFactory”的bean
- amazon-web-services - 当 cloudwatch 日志触发 Lambda 时重启 EC2 实例
- r - ggplot:在y轴行名中创建换行符
- node.js - “npm install ejs --save”在 GitBash 上不起作用,但在 windows powershell 上使用时有效
- react-native - Expo 没有显示我正在开发的当前应用程序
- crystal-reports-2008 - Crystal Reports 参数字段