首页 > 解决方案 > 使用分隔符拆分 Pyspark 列

问题描述

我想用一个点分隔我的 Pyspark 列。该列是在我从 HDFS 读取 CSV 文件时创建的。我使用了下面的代码块

from pyspark.sql import functions as F

split_col = F.split(df['File_ID'], '.')
df = df.withColumn('File_ID', split_col.getItem(0)) \
       .withColumn('csv', split_col.getItem(1)) \
      
df.show(truncate=False)

我有一个错误,比如

TypeError: 'Column' object is not callable

我该如何解决?有什么建议么?

标签: pysparkapache-spark-sql

解决方案


推荐阅读