首页 > 解决方案 > 在python中解析复杂的文本文件

问题描述

我有以下格式的 txt 文件

*15*EN*5562*CB*56198898~ZA*QS*70*EA~ZA*QA*3246*EA~ZA*QP*16020*EA~ZA*QT*12*EA
*16*EN*9966*CB*60526588~ZA*QS*148*EA~ZA*QA*4261*EA~ZA*QP*18000*EA~ZA*QT*6*EA
*17*EN*9973*CB*61540958~ZA*QS*133*EA~ZA*QA*3475*EA~ZA*QP*15600*EA~ZA*QT*12*EA
*18*EN*9980*CB*61540385~ZA*QS*24*EA~ZA*QA*2157*EA~ZA*QP*10062*EA

如何将其转换为预期格式的 csv 文件?

line EN   CB            QS    QA    QP    QT 
15  5562  56198898~ZA   70   3246  16020   12
16  9966  60526588~ZA   148  4261  18000    6
17  9973  61540958~ZA   133  3475  15600   12
18  9980  61540385~ZA    24  2157  10062   NAN

标签: pythonpandasjupyter-notebook

解决方案


像这样

import pandas as pd

df = pd.read_csv('myfile.csv',sep="*",engine='python')

print(df)

推荐阅读