首页 > 解决方案 > 如何将字典的键用作熊猫数据框列?

问题描述

我有一本包含 20 个键的字典,每个键都有从不同语言翻译成法语的句子列表形式的值。关键是告诉我语言的名称。这就是为什么我想在我的数据框的第一列中包含所有字典键。

我想要的是将我的 dict 转换为以字典键作为索引或第一列的数据框。

我的代码

for k, v in Liste_phrases_retraduit.items():
    v = [i.split("\t") for i in v]
    df = pd.DataFrame(v, columns = ['identifiant', 'verbatim', 'etiquette'] )
    print(df.head())

电流输出:

    identifiant                                           verbatim  etiquette
0  identifiant                                           verbatim  etiquette
1          463  Quels problèmes ce concept résout-il ? Nous re...          M
2         2647  Cela signifie donc que pour la solution, vous ...          C
3         5391  Cela ne changera pas la qualité du produit, je...          M
4         1120  C'est très intéressant, parce que c'est un env...          M
   identifiant                                           verbatim  etiquette
0  identifiant                                           verbatim  etiquette
1          463  Quels problèmes ce concept résout-il ? Nous re...          M
2         2647  Cela signifie donc que pour le résoudre, nous ...          C
3         5391  Je ne pense pas que cela changera la qualité d...          M
4         1120  Sur les stations de pompage, c'est très intére...          M
   identifiant                                           verbatim  etiquette
0  identifiant                                           verbatim  etiquette
1          463  Quels problèmes ce concept résout-il ? Nous re...          M
2         2647  Cela signifie donc que pour la solution, vous ...          C
3         5391  Cela ne changera pas la qualité du produit, je...          M
4         1120  sur les stations de pompage, c'est très intére...          M                                    

正如你所看到的,它是一样的,但没有钥匙。我不知道哪些句子属于哪种语言。这将帮助我在稍后阶段过滤数据。

预期输出:

  id_langue  identifiant                                           verbatim  etiquette
0  british   identifiant                                           verbatim  etiquette
1  british        463  Quels problèmes ce concept résout-il ? Nous re...          M
2   ....          2647  Cela signifie donc que pour la solution, vous ...          C
 
0  american   identifiant                                           verbatim  etiquette
1  american       463  Quels problèmes ce concept résout-il ? Nous re...          M
2   ....          2647  Cela signifie donc que pour la solution, vous ...          C
                                                                   

标签: pythonpython-3.xpandasdataframedictionary

解决方案


我找到了解决方案。只需将另一列添加到数据框中并将键作为值。

df['id_langue'] = k 

推荐阅读