apache-spark - Apache Avro 作为 Apache Spark 2.4 中的内置数据源
问题描述
我最近阅读了这篇文章并尝试了该示例,但是当我运行时
val usersDF = spark.read.format("avro")
.load("examples/src/main/resources/users.avro")
但是,当我尝试运行它时,这给了我一个错误。
线程“主”org.apache.spark.sql.AnalysisException 中的异常:找不到数据源:avro。自 Spark 2.4 以来,Avro 是内置但外部的数据源模块。请按照“Apache Avro 数据源指南”的部署部分部署应用程序。在 org.apache.spark.sql.execution.datasources.DataSource$.lookupDataSource(DataSource.scala:647)
解决方案
在阅读Apache Avro Data Source Guide后,我认为 build.sbt 需要使用新的依赖项进行更新。
val sparkVersion = "2.4.0"
"org.apache.spark" %% "spark-avro" % sparkVersion
在此之后一切正常。
推荐阅读
- hyperledger-fabric - Hyperledger Fabric : Impact on transaction when we migrate Orderer
- javascript - In Puppeteer how to switch to chrome window from default profile to desired profile
- android - How to show image in the place of creating message in androidX..?
- html - How to make 4 columns in bootstrap grid break to two then one column
- excel - Excel VBA button. Copy rows from Sheet1 to Sheet2 / Condition: column value
- google-maps - GoogleMaps "Sorry, we have no imagery here" in InternetExplorer 11
- python - Python DictWriter 无法正确写入 lineterminator 作为 '\r\n'
- python - TypeError: 'str' object object 在简单的 read_csv 示例中不可调用
- java - servlet programmatically set authentication
- javascript - Chart.js how to increase segments size to be more evenly distributed