scala - 从 Spark 标头和字段中删除引号
问题描述
我有一个 csv 文件,并且正在使用以下代码上传它:
val bank = spark.read.format("com.databricks.spark.csv").
| option("header", true).
| option("ignoreLeadingWhiteSpace", true).
| option("inferSchema", true).
| option("quote", "").
| option("delimiter", ";").
| load("bank_dataset.csv")
我得到以下信息:
“年龄 | ““工作”” | ““婚姻”” | ““收入”” |
---|---|---|---|
"58 | ""技术"" | ““已婚”” | 58000 |
奇怪的是,第一列的开头只有一个引号,其余列都有双引号。除了年龄前面有引号外,其他数字没有任何引号。
我需要对其进行处理,使其看起来像这样:
年龄 | 工作 | 婚姻 | 收入 |
---|---|---|---|
58 | 技术 | 已婚 | 58000 |
解决方案
推荐阅读
- python - 将 javascript 文件夹转换为 python
- sql - SQL Server:日期减去
- python-asyncio - 无法弄清楚如何正确安排我的异步功能
- c# - 无法使用 MySql 连接编译 c# 项目
- swift - 带有滚动过渡样式的 UIPageViewController 中的大标题不会折叠
- c# - EF Core Attach/AttachRange 方法不起作用
- java - spring boot @EnableConfigurationProperties 标记内部类发生异常
- javascript - 仅在所有转换结束后运行代码
- php - 空字符串爆炸返回一个长度为 1 的数组
- android - 找不到 com.android.tools.build:gradle:4.1.1