scala - Scala:如何在不使用 spark/sql 会话的情况下返回镶木地板文件的 Option[Dataframe](在 adls 中)
解决方案
aDataFrame
是 Spark 的分布式数据集合之一;Spark 创建分布式集合的唯一方法是通过有效的SparkSession
. 没有它你就无法创建DataFrame
。
您提供的链接显示了如何将 Parquet 文件加载到非分布式集合中,而不是加载到DataFrame
.
最简单的 a 类型SparkSession
是本地的,其中 Spark 的所有组件实际上都在进程内运行。这意味着此会话不需要任何配置设置(没有现有的 Spark 进程在任何地方运行或安装)。这主要对测试很有帮助,但可能对您的用例有帮助。以下是您如何创建一个:
import org.apache.spark.sql.SparkSession
val spark = SparkSession.builder.appName("test").master("local").getOrCreate
推荐阅读
- sql-server - Get-SqlErrorLog 电子邮件备份失败
- html - 如何从 html 文档中批量删除此处的整个文本
- flutter - 当您返回更改第一个下拉菜单时,取决于 Dropdown 失败断言错误
- python - 为什么我实现的mergeSort有O(n^2)?
- flutter - 如何在 Flutter 中使用 ListTile 显示列内的项目列表
- gnuradio - gnuradio 标记流到 PDU 块中缺少长度标记
- typescript - Jest 和 Typescript:覆盖默认模拟实现的推荐方法
- ios - Swift:枚举 Int,可编码用于各种情况
- microservices - NestJS 微服务异常处理
- c# - 指定的转换无效。IDataReader 有问题吗?或者我做错了什么?