首页 > 解决方案 > 无法序列化对象:异常:您似乎正在尝试从广播变量中引用 SparkContext

问题描述

使用 python 代码在 spark 中注册用户定义函数时遇到问题,它会抛出错误消息“无法序列化对象:异常:您似乎正在尝试从广播变量、操作或转换中引用 SparkContext

这是代码片段。

    %python

    def checkColumnNames(columnName,inputFilePath):
      filePath = inputFilePath
      data = spark.read.parquet(filePath)
      columnNames = data.limit(1).columns
      toreturn = 0
      if columnName in columnNames:
        toreturn = 1
      else:
        toreturn = 0

      return (toreturn)

    sqlContext.udf.register("checkColumnNames", checkColumnNames)

有人可以帮我吗?

标签: pythonazure-databricks

解决方案


推荐阅读