首页 > 解决方案 > Pyspark 无法从包含反斜杠的 HDFS 中删除文件

问题描述

刚刚注意到 Python、Pyspark 甚至 Hadoop 的奇怪行为。我不小心在 HDFS 上创建了一个名称中带有反斜杠的文件夹:

>hdfs dfs -ls -h
drwxr-xr-x   -user hdfs          0 2020-08-04 08:59 Q2\solution2

我正在使用带有 Python 2.7.5 的 Spark 版本 2.3.0.2.6.5.0-292。

所以这就是我尝试过的。启动 pyspark2,然后执行以下命令:

>import os
>os.system("hdfs dfs -rm -r -f 'Q2\solution2'")
0

文件/文件夹没有被删除!

但是,当我直接从操作系统执行相同的命令时......

hdfs dfs -rm -r -f 'Q2\solution2'

文件/文件夹被删除!

谁能解释为什么会这样?

标签: pythonhdfsdelete-filebackslash

解决方案


推荐阅读