首页 > 解决方案 > 按确定的元素分解熊猫行

问题描述

我正在使用 MovieLens 数据集,电影 csv 如下所示:

在此处输入图像描述

如何爆炸流派列,以便每部电影都有一个流派,例如:

movieId       title                  genres

1            "Toy Story (1995)"      Adventure

1            "Toy Story (1995)"      Animation

1            "Toy Story (1995)"      Children

1            "Toy Story (1995)"      Comedy

1            "Toy Story (1995)"      Fantasy

2            "Jumanji (1995)"        Adventure
...

标签: pandasdataframepandasql

解决方案


在 pandas 0.25.0 之后的版本中我们可以做explode

df=df.assign(genres=df.genres.str.split('|')).explode('genres')

推荐阅读