首页 > 解决方案 > 如何理解 hdfs -du 结果

问题描述

我正在尝试使用命令hdfs dfs - du -h列出文件和文件夹的大小。我使用的命令是hdfs dfs - du -h /path_name/folder_name,返回的结果就像

9.2 G   27.5 G  /path_name/folder_name/xxx01.parquet
0       0       /path_name/folder_name/xxx02.parquet
19.9 M  59.6 M  /path_name/folder_name/xxx03.parquet

我知道 hadoop 命令行从通用文件系统命令中借鉴了很多,并且-du -h列出了人类可读的文件夹/文件大小。但是,(以第一个结果行为例)这两个数字9.2 G 27.5 G分别是什么意思?

谢谢!

标签: hadoopfilesystems

解决方案


您的集群复制因子是 3。第一个数字是文件纯大小,第二个数字是带有 repicas 的文件大小。例如实际文件大小为 9.2 GB。因为复制因子是 3,所以带有副本的文件大小是 27.5GB

size      disk space consumed with all replicas full_path

推荐阅读