csv - spark如何仅推断某些特定列的类型?
问题描述
我.options("inferSchema" , "true")
用来推断数据框的架构并进行架构检查。
但我只想为某些特定列停用此推断模式。
原因是我们string
在预期为 的列中偶尔收到 a integer
,但它失败了。
当文件仅包含integer
==> 时,spark 将其推断为integer
==> 一切都很好 但有时而且很少见,我们会string
在本专栏中收到一些。然后它失败了。
我不能期望string
每天都有一个==>,因为大多数情况下spark
都会推断出它,并且模式检查会失败。integer
这就是为什么我想检查 spark 是否只能推断某些列的类型检查,而不是所有数据帧的原因。并让另一列为strings
。
option("quote","")
替代方案是仅在某些字段上设置参数。
解决方案
推荐阅读
- navigation - 如何从后退按钮中删除标题
- node.js - 了解异步函数 --> 第二个函数运行很快
- c# - 属性类中的设置数量是否有限制
- android - Android Studio - 如何避免 VideoView 溢出其(视图)容器?
- file - 将一行复制到文本文件中,在该行内增加一个数字
- vue.js - 如何使用 VestaCP 在 VPS 上部署 Nuxt?
- javascript - 控制器上的对象属性为空
- javascript - 如何在 cPanel 服务器上使用 React 设置 SSL 证书?
- c++ - 问题一:调用函数的执行时间
- excel - VBA Excel 错误“对象变量或未设置块变量”运行时错误 91 和 438