apache-spark - spark 3.0 中的 glob
问题描述
我曾经运行 glob 来获取 Spark 2.0+ 下的文件路径。
glob.glob("/dbfs/mnt/.../*/Acquisition*.txt")
升级到 Spark 3.0 后,此命令不起作用。你知道为什么吗?
解决方案
检查与python 2.7 版本有点不同的 python 3.8 版本的文档
您应该使用**
递归路径并且还必须打开选项recursive=True
。然后,
glob.glob('/path/from/root/**/Acquisition*.txt', recursive=True)
推荐阅读
- java - Gson如何将已知大小的列表转换为多个字段
- python - 来自 Django 模型的表单中的自定义选择框字段
- gun - 如何触发 .on()
- javascript - html中的图像在页面中无法正确显示
- python - 在具有第二个数据帧行条件的数据帧中添加计数行
- http - 将 mor 信息添加到颤振选项卡
- html - 使用模型中的值,或者如果它未定义,则使用默认值
- java - getInputStream() 和 getOutputStream() 的 python 等价物是什么?
- python - 检查值是否高于阈值,如果是,则替换为
- javascript - TypeScript 定义文件必须位于包的根目录吗?