apache-spark - 从 Avro 文件读取时火花提交失败
问题描述
尝试使用 spark-submit 运行我的 spark jar 时,出现错误。导致它的线
spark.read.format("com.databricks.spark.avro").load("/home/user/samples/events")
堆栈跟踪是:
Exception in thread "main" java.util.ServiceConfigurationError: org.apache.spark.sql.sources.DataSourceRegister: Provider org.apache.spark.sql.execution.datasources.orc.OrcFileFormat not found
at java.util.ServiceLoader.fail(ServiceLoader.java:239)
at java.util.ServiceLoader.access$300(ServiceLoader.java:185)
at java.util.ServiceLoader$LazyIterator.nextService(ServiceLoader.java:372)
at java.util.ServiceLoader$LazyIterator.next(ServiceLoader.java:404)
at java.util.ServiceLoader$1.next(ServiceLoader.java:480)
at scala.collection.convert.Wrappers$JIteratorWrapper.next(Wrappers.scala:43)
at scala.collection.Iterator$class.foreach(Iterator.scala:893)
at scala.collection.AbstractIterator.foreach(Iterator.scala:1336)
at scala.collection.IterableLike$class.foreach(IterableLike.scala:72)
at scala.collection.AbstractIterable.foreach(Iterable.scala:54)
at scala.collection.TraversableLike$class.filterImpl(TraversableLike.scala:247)
at scala.collection.TraversableLike$class.filter(TraversableLike.scala:259)
at scala.collection.AbstractTraversable.filter(Traversable.scala:104)
at org.apache.spark.sql.execution.datasources.DataSource$.lookupDataSource(DataSource.scala:529)
at org.apache.spark.sql.execution.datasources.DataSource.providingClass$lzycompute(DataSource.scala:86)
at org.apache.spark.sql.execution.datasources.DataSource.providingClass(DataSource.scala:86)
at org.apache.spark.sql.execution.datasources.DataSource.resolveRelation(DataSource.scala:301)
at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:178)
at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:156)
无法理解缺少什么以及为什么它调用 ORC 格式?我确保该类存在于 spark/jar 文件夹“org/apache/spark/sql/execution/datasources/orc/OrcFileFormat”中
火花版本:2.3.2
谢谢 :-)
解决方案
推荐阅读
- java - 如何在 JEditorPane 中解决此问题
- r - 使用 R,如何根据另一个数据框的行复制数据框的内容?
- ionic-framework - style.background 绑定在 ionic3 中不起作用
- javascript - axios.all 的动态使用
- javascript - 每个项目的 react-native start 都失败
- angular - 使用各种测试数据进行角度单元测试
- python - 置换字符串中的字符
- c# - Simple.OData.Client 不返回结果,没有错误
- c# - IRabbitMqHost autofac注册问题
- python - 'Tensor' 对象不支持项目分配,而需要在张量数组中切片然后进行分配