首页 > 解决方案 > 将三重嵌套列表转换为 Python 数据框

问题描述

我有这个要转换为数据框的数据列表:

在此处输入图像描述

有 22 个索引(让我们将其重命名为 docs),如果我们检查每个 doc(让我们看看 doc 0):

在此处输入图像描述

现在,我想将这个三重嵌套列表转换为数据框,其中的列是'Word''Pos''Biotag'。如果我们以第二张图片为例,表格将是:

Word        Pos      Biotag
____________________________
S7892537B1  NNP      O
-           :        O
High        JJ       O
...

但是,这只是来自第一个文档的数据。我想将所有 22 个文档添加到单个数据框中,并且我想添加指示每个条目的文档的“文档”列,例如:

Word        Pos      Biotag    Docs
___________________________________
S7892537B1  NNP      O         0
-           :        O         0
High        JJ       O         0
...
encoding    VBG      O         2
Dev.        NNP      I         2
...
et          NNP      I         22 

我已经尝试过thisthat,但是返回的列总是不匹配。任何帮助表示赞赏,谢谢。

标签: pythonpandasdataframenested-lists

解决方案


对于单个文档:

df_new = pd.DataFrame(df['Value'].values.tolist(), columns=['Word', 'Pos', 'Biotag'])

您想如何处理多个文档?


推荐阅读