首页 > 解决方案 > 将字典中的值解析为 pyspark 中的列表

问题描述

[![在此处输入图片描述][1]][1]我要转换列中现有的JSON:

namedTags = [{"rid":"ri.compass..ae1","name":"reservoir"},     
{"rid":"ri.compass..ed18","name":cave"},      
{"rid":"ri.compass..c97","name":"staging"}]

我只想将名称收集到列表中

新列中的预期输出:

['reservoir','cave','staging']

数据框看起来像这样 [1]:https ://i.stack.imgur.com/X1TAv.png

标签: pythonpyspark

解决方案


df['col'] = df['some_other_col'].apply(lambda row: [x.get('name',0) for x in row] )

推荐阅读