python - 在 Pandas 中解析大字符串值
问题描述
我有一个.csv
从中生成数据框的。此 csv 具有来自遵循以下格式的系统的原始数据输出:
{"DataType1":"Value","DataType2":"Value","DataType3":"Value",.....}
数据框中的每一行都只有 1 列。我试图打破这一点,以便数据类型成为列标题并且值填充行。另一方面是并非所有行都具有相同的数据类型,有些行具有其他行中可能不存在的附加数据类型。例如,第 1 行可能有DataType1
、DataType2
和 ,DataType3
而第 2 行可能有DataType2
、DataType4
和DataType5
。理想情况下,我希望输出使列标题包含所有数据类型,无论该行是否具有值。所以最终的数据框将是这样的结构:
-------------------------------------------------------------
| DataType1 | DataType2 | DataType3 | DataType4 | DataType5 |
-------------------------------------------------------------
| Value | Value | Value | NaN | NaN |
-------------------------------------------------------------
| NaN | Value | NaN | Value | Value |
-------------------------------------------------------------
解决方案
从字典转换时,数据帧遵循以下格式:
dict = {'column 1':[1,2], 'column 2':[3,4], ...}
请注意,每个键中值的长度相同或
pd.DataFrame(dict)
会抛出错误。
要超越错误,您可以遍历 dict 并通过解析它来制作 DataFrame。
pd.DataFrame(dict([(k,pd.Series(v)) for k,v in dict.items() ]))
*假设 'dict' 是您的字典名称。
这样,您将获得所需的输出。
推荐阅读
- tensorflow - model.execute(dict)中提供的dict['ToFloat']的shape必须是[]
- url - 如何在 VS Code 中更改 LocalHost URL
- audio - 如何在 Ffmpeg 中将音频速度设置为 0.3?
- gnuradio - 如何在 GNU-radio 中设置 USRP 天线
- excel - VBA正则表达式反向查找特殊字符
- wpf - 如何在wpf中删除anchorItem
- r - 运行回归,其中整个列在 R 中包含 NA
- python - 如何从数据框上的文本字段中删除松散的字母
- javascript - 使用方法 vanilla java 脚本访问对象中的布尔值
- javascript - 在 Redux 中将道具传递给动作创建者