python - 如何在没有熊猫的情况下在python中分组
问题描述
我需要你的帮助来解决这个问题。我试图环顾四周,但我什么也得不到。我也不想使用熊猫。我找到了一个小例子,它确实工作得很好。但是当我将它应用于我的数据时,它不起作用并且它不进行分组。知道它可能来自哪里吗?我会很感激...
这是我的数据和输出:
liste_of_values =
[[0, 0, 'sv_SE', 'SE', 'Tarket', '04/18/2021'],
[1, 0, 'en_EU', 'EU', 'Tarket', '04/18/2021'],
[2, 0, 'en_EU', 'EU', 'Tarket', '04/18/2021'],
[3, 0, 'en_EU', 'EU', 'Tarket', '04/18/2021'],
[4, 0, 'en_EU', 'EU', 'Tarket', '04/18/2021'],
[5, 0, 'en_EU', 'EU', 'Tarket', '04/18/2021'],
[7, 0, 'en_EU', 'EU', 'Tarket', '04/18/2021'],
[8, 1, 'sv_SE', 'SE', 'Tarket', '04/18/2021'],
[9, 1, 'sv_SE', 'SE', 'Tarket', '04/18/2021'],
[10, 0, 'en_EU', 'EU', 'Tarket', '04/18/2021'],
[11, 1, 'sv_SE', 'SE', 'Tarket', '04/18/2021'],
[12, 0, 'en_EU', 'EU', 'Tarket', '04/18/2021'],
[13, 0, 'en_EU', 'EU', 'Tarket', '04/18/2021'],
[14, 0, 'en_EU', 'EU', 'Tarket', '04/18/2021'],
[15, 0, 'en_EU', 'EU', 'Tarket', '04/18/2021'],
[16, 0, 'en_EU', 'EU', 'Tarket', '04/18/2021'],
[17, 0, 'en_EU', 'EU', 'Tarket', '04/18/2021'],
[18, 0, 'en_EU', 'EU', 'Tarket', '04/18/2021'],
[19, 0, 'en_EU', 'EU', 'Tarket', '04/18/2021'],
[20, 0, 'en_EU', 'EU', 'Tarket', '04/18/2021'],
[21, 0, 'en_EU', 'EU', 'Tarket', '04/18/2021'],
[22, 0, 'en_EU', 'EU', 'Tarket', '04/18/2021']]
groupby =[[k, sum(int(v[1]) for v in g)] for k, g in groupby(list_of_values, key = lambda x: (x[3], x[4], x[5]))]
OUTPUT :
[[('SE', 'Tarket', '04/18/2021'), 0],
[('EU', 'Tarket', '04/18/2021'), 0],
[('SE', 'Tarket', '04/18/2021'), 2],
[('EU', 'Tarket', '04/18/2021'), 0],
[('SE', 'Tarket', '04/18/2021'), 1],
[('EU', 'Tarket', '04/18/2021'), 0]]
这是我找到的示例(有效):
from itertools import groupby
data = [['Dave', 3, 'Red'], ['Dave', 4, 'Red'], ['Dave', 2, 'Blue'], ['Sue', 4, 'Red'], ['Sue', 1, 'Red'], ['Sue', 3, 'Yellow']]
projuserDays=[[k, sum(v[1] for v in g)] for k, g in groupby(data, key = lambda x: (x[0], x[2]))]
OUTPUT:
[[('Dave', 'Red'), 7],
[('Dave', 'Blue'), 2],
[('Sue', 'Red'), 5],
[('Sue', 'Yellow'), 3]]
太感谢了
解决方案
因为itertools.groupby
您必须在分组之前按相同的键对数据进行排序:
>>> key = lambda x: (x[3], x[4], x[5])
>>> [[k, sum(int(v[1]) for v in g)] for k, g in groupby(sorted(list_of_values, key=key), key=key)]
[[('EU', 'Tarket', '04/18/2021'), 0], [('SE', 'Tarket', '04/18/2021'), 3]]
推荐阅读
- python - Keras flow_from_dataframe
- javascript - 使 getElementsByClassName 以每个元素为目标
- php - Paypal Rest API 支付未响应 PHP
- keras - keras 多标签图像分类中的混淆矩阵和测试精度
- c# - Automapper、Entity Framework Core 和多个嵌套集合
- excel - 如果 Checkbox 值 if 语句为 TRUE,则将文本值添加到 Userform 文本框
- windows - 即使在远程桌面注销 VPS 后如何运行 .exe 文件 24/7
- flutter - 如何在没有尾随空格的情况下显示 Flutter AppBar
- python - 连接具有相同分区数但列数不同的两个数据帧(dask)
- php - 如何将可空变量转换为不可空类型?