scala - 在scala中递归读取文件
问题描述
我正在尝试将嵌套在许多文件夹中的一组 XML 文件读入 spark 中的序列文件。我可以使用函数 recursiveListFiles 从如何列出 scala 的子目录中的所有文件中读取文件名?.
import java.io.File
def recursiveListFiles(f: File): Array[File] = {
val these = f.listFiles
these ++ these.filter(_.isDirectory).flatMap(recursiveListFiles)
}
但是如何在这里将文件内容作为单独的列读取?
解决方案
使用 sparks wholeTextFiles 方法怎么样?然后自己解析XML?
推荐阅读
- c# - 打开其他 EXCEL 文件时不加载 VSTO Excel 模板
- python - 在 tensorflow 中,如何将索引列表转换为指标向量?
- python - 如果循环为空,则显示一条消息
- php - fgets 一个 UTF-8 txt 文件返回垃圾字母,当文件为空白时返回 true
- android - Android Socket.io 后台服务
- android - 数据绑定不能用 String.function() 调用静态函数
- javascript - 使用 JQuery 或 JavaScript 更改 DIV 中的更新/更改订单号
- android - 如何让 VrVideoView 在 Cardboard 模式下启动?
- html - 这个元素是什么类型的?
- sql - 如何在程序中连接用户?