首页 > 解决方案 > 如何根据列中的列表元素对数据框进行分组

问题描述

我有一个这样的数据框:

   movie_id genres
0         2  [1,2]
1         3  [1,3]
2         4  [2,4]

我想根据流派类型制作电影组(有重复)。像这样:

   genre_group movie_id genres
0            1        2  [1,2]
1                     3  [1,3]
0            2        2  [1,2]
2                     4  [2,4]
1            3        3  [1,3]
2            4        4  [2,4]

标签: pythonpandaspandas-groupby

解决方案


您可以使用explodemap

df1 = df.explode('genres').sort_values('genres').rename(
                    columns={'genres' : 'genres_group'})\
                   .set_index('genres_group',append=True)
 

df1['genres'] = df1.index.get_level_values(0).map(df['genres'])   

print(df1)

                movie_id  genres
  genres_group                  
0 1                    2  [1, 2]
1 1                    3  [1, 3]
0 2                    2  [1, 2]
2 2                    4  [2, 4]
1 3                    3  [1, 3]
2 4                    4  [2, 4]

推荐阅读