首页 > 解决方案 > 使用 Python 进行数据清理

问题描述

我有一个不统一的数据集,我想消除以 $ 符号开头的单词,并代替删除的单词,我想在删除的单词之后保留下一个单词。如何解决这个问题。

DAY1 APPLE BANANA POTATO $aarb GRAPES PINEAPPLE


DAY2 APPLE BANANA $aarb POTATO GRAPES PINEAPPLE


DAY3 APPLE BANANA $aarb POTATO GRAPES

例如:如果我从第一行中删除 $aarb,下一个单词 GRAPES 必须代替 $aarb,PINEAPPLE 必须代替 GRAPES。

请任何人帮助我。提前致谢。

标签: pythonexcelpython-3.x

解决方案


import csv
import re

with open('test.csv') as csvfile:
    readCSV = csv.reader(csvfile,delimiter=',')
    for row in readCSV:
        r = re.compile('[^$]')
        newlist = list(filter(r.match,row))
        print(newlist)

随意替换任何你想用的东西print(newlist),你可以写入文件或输出到其他地方。


推荐阅读