scala - Spark SQL:是否可以从外部源读取自定义模式,而不是在 spark 代码中创建它?
问题描述
尝试在没有模式推断的情况下加载 csv 文件。通常我们在 spark 代码中将模式创建为 StructType。是否可以将架构保存在外部文件(可能是属性/配置文件)中并在创建数据框时动态读取它?
val customSchema_v2 = new StructType()
.add("PROPERTY_ID_2222", "int" )
.add("OWNER_ID_2222", "int")
是否可以将模式(即“PROPERTY_ID_2222”、“int”和“OWNER_ID_2222”、“int”)保存在文件中并从那里调用模式?
解决方案
StructType 和 StructField 都可以 Serializable,所以你可以将一个 StructType 序列化为一个文件,并在需要的时候反序列化
推荐阅读
- javascript - Nothing was returned from render when using prototype
- python - 使用结构化数组在 numpy 数组中命名轴
- ajax - Woocommerce 结帐页面 - Ajax 刷新运费
- python - 线程阻塞了控制台
- matlab - 在左侧对齐子图 ylabel
- iis - IIS:可导出 SSL 证书请求和私钥
- python - Firestore:收听子集合中的文档
- android - 在 react native 中发布 apk 时出现“react-native-gesture-handler”错误
- javascript - Javascript按字母和数字顺序将图像导入Photoshop
- java - 当我关闭并 admob 插页式广告时,它会发生意外的活动