首页 > 解决方案 > 自动拆分具有异常字符的 CSV

问题描述

虽然我可以使用 Python 操作一个 CSV 文件,如果它是严格用逗号分隔的,但我正在使用这种格式时遇到了一个大问题。它是逗号分隔的,但最后一列由下图中的大约六个逗号组成的网格组成:

"{""EvidenceDetails"": [{""MitigationString"": """", ""Criticality"": 2, ""Timestamp"": ""2018-05-07T13:51:02.000Z"", ""CriticalityLabel"": ""Suspicious"", ""EvidenceString"": ""1 sighting on 1 source: item. Most recent item: Item4: item. I've never seen this IP before. Most recent link (May 7, 2018): link"", ""Rule"": ""Recent""}, {""MitigationString"": """", ""Criticality"": 2, ""Timestamp"": ""2018-05-09T05:32:41.316Z"", "etc"}]}"

其他列是标准的逗号分隔,但这一列是一团糟。我只需要提取时间戳的 YYYY-MM-DD;没有其他的。但是,我似乎无法找到去除不必要字符的方法。

有什么建议么?我正在专门使用 Python,但如果我还有其他需要注意的地方,请告诉我!

谢谢!

标签: python

解决方案


您正在查看 JSON 格式,因此请尝试使用该json模块:

import json

# if data is in a file
with open('your filename here','r') as f:
    data = json.load(f)

# if data is stored in a string variable
data = json.loads(stringvar)

data 变量现在应该以更易于访问的格式包含您的数据。


推荐阅读