首页 > 解决方案 > Pandas DataFrame - 规范化

问题描述

我有一个包含两列的数据框:doc_id,文本

我已经标记了我的文本,但我想为每个 doc_id、token 创建一个新行。

对我来说最有效的方法是什么?

原样:

doc_id    text
1         "cat mat home"
2         "dog mat table"

成为:

doc_id    text
1         cat
1         mat
1         home
2         dog
2         mat
2         table

标签: pythondatabasepandas

解决方案


推荐阅读