首页 > 解决方案 > Pyspark 中出现错误 - TypeError: 'list' object is not callable

问题描述

注意 - 请注意,我已经在类似问题的答案中查看了建议。而且我没有名为 List 的变量。

基本上我试图确保我的 rdd 的每一行中的元素数量是恒定的,以便我可以在 rdd 上应用统一的模式这是我在收到错误时尝试运行的代码。这曾经工作到大约一个月前。

tag0620_selected = tag0620_selected.map(lambda x: tuple([x[i] if i < len(x) else None for i in range(30)]))

这是我试图在其上运行此代码的 rdd 中的两行的示例:

[(0, 45, 'TAG0620', '4D6J9ISKF08KB', '', '', 'O', '1', '3EX4F5S3MB4OU', 'Bremerhaven', '', '2U4AD56P1LNIY', 'NTB North SEA Terminal Bremerhaven', '1PLJ5T7MFKBJY', 'Germany', '', '', '', '', '2020-02-06 17.07.45', 'JWA207', '2020-02-06 17.07.45', 'JWA207', '30EJA7RKPF1J2', 'Bremen', 'HB', 'DE', 'DEBRV', 'DEBRVTM'), (0, 47, 'TAG0620', 'SYIK9ISKF08KB', '', '', 'O', '2', '1JUKNJGWHQBNJ', 'Rotterdam', '', '2LME4YKE32WZJ', 'APM Terminals Rotterdam', '0QKGIC8VAS51A', 'Netherlands', '', '', '', '', '2020-02-06 17.07.45', 'JWA207', '2020-02-06 17.07.45', 'JWA207', '2ON031AD5FX4U', 'Zuid-Holland', 'ZH', 'NL', 'NLROT', 'NLROT01')]

标签: pythonpyspark

解决方案


推荐阅读