python-3.x - 在 Pandas 中拆分、清理并将列表列表转换为数据框
问题描述
我有一个列表如下:
[['id:ZC0000218734', 'version: forth', 'date:2020-07-06'], ['v1:\n undefined', 'v2: undefined'], ['type:park', 'address:zhejiang...'], ['type:park', 'address:zhejiang...']]
我怎样才能删除重复的列表(ie: ['type:park', 'address:zhejiang...']
),拆分:
,清理\n
和空格,然后将其转换为数据框?
预期的结果将是这样的:
id version date ... v2 type address
0 ZC0000218734 forth 2020/7/6 ... undefined undefined zhejiang...
谢谢。
解决方案
lst = [['id:ZC0000218734', 'version: forth', 'date:2020-07-06'], ['v1:\n undefined', 'v2: undefined'], ['type:park', 'address:zhejiang...'], ['type:park', 'address:zhejiang...']]
d = {v.split(':')[0]: v.split(':')[1].strip() for l in lst for v in l}
df = pd.DataFrame([d])
print(df)
印刷:
id version date v1 v2 type address
0 ZC0000218734 forth 2020-07-06 undefined undefined park zhejiang...
推荐阅读
- keras - 使用 Kears 开发自动编码器时形状不匹配?
- git - 在 git for-each-ref 中,%(refname) 和 %(upstream:remoteref) 有什么区别?
- node.js - 我在 mongo db atlas 中看不到我的收藏
- r - 从另一个数据集中连接一个变量
- kubernetes - 如何在 Kubernetes 中打开自定义端口
- angular - 检测元素 Angular 9 外部的点击 - 多个实例
- python - 如何在 QTableView 中发出单元格输入和单元格左侧的信号
- r - 计算R中两列的某些值的总和
- postgresql - 解密使用 C# 加密的 PostgreSQL 查询中的数据
- c++ - VS Code debug C++, args 有加的话