首页 > 解决方案 > 熊猫数据框根据特定列对行进行分组

问题描述

我有一个看起来像这样的表:

   P_id   S_id   Time
1  20     A    15 
2  30     B    50
3  50     A    99 
4  70     A    60

我想根据“Sid”列对表格进行分组,并按“时间”列排序,所以它看起来像这样:

     P_id       S_id   
1  20,70,50       A     
2    30           B    

做这个的最好方式是什么?

标签: pythonpandasdataframedata-munging

解决方案


你可以试试这个。df 这是您的数据框的名称

import pandas as pd
df2 = pd.DataFrame({'S_id': ['A', 'B']})
df2.loc[:,'P_id'] = ''
for letter in df2.S_id.unique():
    indx = df2.loc[df2['S_id']==letter].index.values
    df1 = df.sort_values(by = ['S_id' ,'Time'])
    array_values = list(df1[df1.S_id ==letter].P_id.values)#.astype(object)
    df2.at[indx[0], 'P_id'] = array_values
df2

推荐阅读