首页 > 解决方案 > Pandas 按单元格解析

问题描述

我有一个包含 n 列和 n 行的数据框。一些单元格包含多个值,由“;”分隔 我不知道如何遍历数据框中的每个单元格,如果遇到这种情况将单元格分成多个单元格。

我遇到的问题示例

上面的图片在谷歌表格中,但我需要一个熊猫数据框的解决方案。

提前感谢任何帮助谢谢:)

标签: pythonpandasdatabasedataframedata-cleaning

解决方案


东风:

1 2 3 4
a;b;d; a;b g;a a
c;f f e g
e d

尝试通过以下方式进行explode

exploded = [df[col].str.rstrip(';').str.split(';').explode().reset_index(drop=True) for col in df.columns]
df2 = pd.DataFrame(dict(zip(df.columns, exploded)))

df2:

    1   2   3   4
0   a   a   g   a
1   b   b   a   g
2   d   f   e   None
3   c   d   None    NaN
4   f   NaN NaN NaN
5   e   NaN NaN NaN

推荐阅读