scala - 如何读取带有分隔符 /u0001 的 .dat 文件并记录下一条记录将通过 scala 中的下一行分隔
问题描述
我有 .dat 扩展文件,其中没有任何标题 1.由 '\u0001' 分隔的字段 2.下一条记录将在新行中
如何使用 scala 在 spark 中读取此文件并转换为数据帧。
解决方案
试试下面的代码,我假设你使用的是 spark > 2.x 版本-
val df = spark
.read
.option("header", "true")
.option("inferSchema", "true")
.option("delimiter", "\01")
.csv("<CSV_FILE_PATH_GOES_HERE>")
推荐阅读
- bash - 使用 bash 删除配置文件中的部分
- python - R 中 12 个 excel 工作簿的数据合并(每个包含 3 个工作表)
- c# - 如何使游戏对象实体化
- frida - ssdeep 模糊哈希和 frida 服务器二进制文件
- react-native - 我在 6 个月前为 cognito 注册配置了 aws-amplify sdk。我想更新它以进行社交注册(谷歌)
- java - 自动生成包含泛型类型的构建器模式
- scala - Spark 3 流作业失败,无法运行程序“chmod”
- typescript - (!class || case2){} 如何在打字稿中工作?
- c++ - 如何测试控制台是否支持 ANSI 颜色代码?
- c++ - operator& 返回一个 int 并对 2 个向量进行操作?