首页 > 解决方案 > 在 PySpark RDD 中交换键值

问题描述

我正在使用 PySpark RDD。当我使用map函数生成(key-value)时,这两者的位置不正确,需要交换。

这是我的地图功能:

rdd8=rdd5.map(lambda word : (word,1) )
rdd8.collect()

我收到了这个结果:

 ('کاغذ', 1),
 ('داره', 1),
 ('و', 1),
 ('هر', 1),
 ('خطی', 1),
 ('را', 1),
 ('بکشید', 1),
 ('ثبت', 1),
 ('می', 1),
 ('کنه', 1),
 ('طراحی', 1),
 ('زیبا', 1),
 ('رنگ', 1),
 ('زرد', 1),
 ('زیبا', 1),
 ('صفر', 1),
 ('تاصد', 1),
 ('عالی', 1),

标签: apache-sparkpysparkrdd

解决方案


您可以映射 rdd8 并交换元组元素:

new_rdd = rdd8.map(lambda x: (x[1], x[0]))

推荐阅读