python - 使用 Python 进行数据清理
问题描述
我有一个不统一的数据集,我想消除以 $ 符号开头的单词,并代替删除的单词,我想在删除的单词之后保留下一个单词。如何解决这个问题。
DAY1 APPLE BANANA POTATO $aarb GRAPES PINEAPPLE
DAY2 APPLE BANANA $aarb POTATO GRAPES PINEAPPLE
DAY3 APPLE BANANA $aarb POTATO GRAPES
例如:如果我从第一行中删除 $aarb,下一个单词 GRAPES 必须代替 $aarb,PINEAPPLE 必须代替 GRAPES。
请任何人帮助我。提前致谢。
解决方案
import csv
import re
with open('test.csv') as csvfile:
readCSV = csv.reader(csvfile,delimiter=',')
for row in readCSV:
r = re.compile('[^$]')
newlist = list(filter(r.match,row))
print(newlist)
随意替换任何你想用的东西print(newlist)
,你可以写入文件或输出到其他地方。
推荐阅读
- windows - CreateWindow() 返回的 HWND 的格式值是什么?
- javascript - 使用 nodejs 打印 json 对象内容
- swift - 如何在 Swift 中为属性包装器创建前缀函数,就像 SwiftUI 中的“$”一样
- postgresql - 连接到我的 postgres 数据库实例的问题
- javascript - 如何在反应中设置嵌套组件的样式?
- typescript - React-leaflet:默认标记在缩放时移动
- c - 如何在C中重复矩阵中的行?
- node.js - cookie 会话在 CodeSandbox 和 Repl 上不起作用?
- python-3.x - 如何有效地计算 Pandas 列表列中每个值的出现次数?
- r - 如何获得具有唯一 ID 而不是唯一 ID 的最小行