python - Pyspark 无法从包含反斜杠的 HDFS 中删除文件
问题描述
刚刚注意到 Python、Pyspark 甚至 Hadoop 的奇怪行为。我不小心在 HDFS 上创建了一个名称中带有反斜杠的文件夹:
>hdfs dfs -ls -h
drwxr-xr-x -user hdfs 0 2020-08-04 08:59 Q2\solution2
我正在使用带有 Python 2.7.5 的 Spark 版本 2.3.0.2.6.5.0-292。
所以这就是我尝试过的。启动 pyspark2,然后执行以下命令:
>import os
>os.system("hdfs dfs -rm -r -f 'Q2\solution2'")
0
文件/文件夹没有被删除!
但是,当我直接从操作系统执行相同的命令时......
hdfs dfs -rm -r -f 'Q2\solution2'
文件/文件夹被删除!
谁能解释为什么会这样?
解决方案
推荐阅读
- python - 没有 $DISPLAY 环境变量
- string - (MASM32) 使用调用 ReadString 读取以空格分隔的整数值时,有没有办法将它们视为单独的整数?
- php - 不同的htaccess目录和子目录重定向
- c - 字符位图有一些标准吗?
- flutter - 我不明白 Flutter 中 Theme 类的意义
- javascript - 基于条件和对象值的对象的Javascript数组计数
- python - 从任务中引发忽略不会确认消息
- java - 检查 BigInteger 是否为完美正方形的复杂性
- android - 片段未与片段管理器关联。(对话片段)
- java - 我想写一个代码来回答一个无限系列,它有交替加减运算。我看不到错误,在我的代码中