首页 > 解决方案 > 如何处理多键值但减少第一个键?

问题描述

如果我有一个键值对,例如

('a',1),v1
('a',2),v2
('a',3),v3
('b',1),v4
('b',2),v5
('b',3),v6

我怎样才能得到

('a',1),v1
('a',2),v2+v1
('a',3),v3+v2+v1
('b',1),v4
('b',2),v5+v4
('b',3),v6+v4+v5

通过使用

flatmap().reducebykey()

标签: pyspark

解决方案


推荐阅读