github - 通过 livy 提交存储在 github 中的文件以触发 spark
问题描述
我正在尝试通过 livy 运行火花工作。我正在创建一个活跃的批处理会话,我需要文件参数是一个 github URI(类似这样 - https://raw.githubusercontent.com/repo/branch/path/to/file/filename?token=asdasdasd)(如果回购是私有的,将包括令牌)
LivyBatch.create(url = <livy_server_url>,
file = <>
args = <args>,
spark_conf = <pyspark_config>)
当我尝试这样做时,我收到以下错误消息:WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable Exception in thread "main" org.apache.spark.SparkException: Failed to get main class in JAR with error 'null'. Please specify one with --class
.
当我提供file
参数作为aws s3
路径时,我能够成功运行相同的代码。
解决方案
推荐阅读
- android - Viewpager2 占用全屏的约束布局
- c# - 为什么 Math.Round() 会根据架构(x86 与 x64)进行不同的舍入?
- javascript - 获取输入类型“文本”的动态值
- bash - 使用命令行数据块提交具有不同参数的作业
- c# - 如何概括代码以在 WPF 应用程序中每个窗口只允许一个实例
- vhdl - Basys2 FPGA板上的VHDL简单七段显示
- apache-spark - 如何在流式传输 Dataframe 时读取和显示示例(10)记录?
- javascript - 按对象数组分组
- typescript - StaticInjectorError(Platform: core)[Config]:NullInjectorError: No provider for Config!NullInjectorError:StaticInjectorError(AppModule)[配置]:
- flutter - 当我实现启动画面时,应用程序崩溃了