python - 无法序列化对象:异常:您似乎正在尝试从广播变量中引用 SparkContext
问题描述
使用 python 代码在 spark 中注册用户定义函数时遇到问题,它会抛出错误消息“无法序列化对象:异常:您似乎正在尝试从广播变量、操作或转换中引用 SparkContext ”
这是代码片段。
%python
def checkColumnNames(columnName,inputFilePath):
filePath = inputFilePath
data = spark.read.parquet(filePath)
columnNames = data.limit(1).columns
toreturn = 0
if columnName in columnNames:
toreturn = 1
else:
toreturn = 0
return (toreturn)
sqlContext.udf.register("checkColumnNames", checkColumnNames)
有人可以帮我吗?
解决方案
推荐阅读
- powershell - 脚本中的 msiexec 和 pssession 问题
- reactjs - 如何在本机反应中一一为单个视图设置动画?
- dialogflow-es - Dialogflow 代理/项目自动消失
- python - OrderedCounter 返回 RecursionError
- c# - 如何将以下用于使用 EF 6 进行数据库连接的代码转换为 C# 中的异步任务?
- corda - 我想在corda中同时搜索和寻呼
- bash - 如果下一行不以 `>` 开头,则删除新行
- java - 在使用 JNI 将 c++ unordered_map 返回到 java 之前将其转换为 java hashMap
- c# - 我可以用 php/nodejs 与 SignalR api 交谈吗
- c++ - 为什么 int8_t 的输出格式使用 4 个字节?