hadoop - 如何理解 hdfs -du 结果
问题描述
我正在尝试使用命令hdfs dfs - du -h
列出文件和文件夹的大小。我使用的命令是hdfs dfs - du -h /path_name/folder_name
,返回的结果就像
9.2 G 27.5 G /path_name/folder_name/xxx01.parquet
0 0 /path_name/folder_name/xxx02.parquet
19.9 M 59.6 M /path_name/folder_name/xxx03.parquet
我知道 hadoop 命令行从通用文件系统命令中借鉴了很多,并且-du -h
列出了人类可读的文件夹/文件大小。但是,(以第一个结果行为例)这两个数字9.2 G 27.5 G
分别是什么意思?
谢谢!
解决方案
您的集群复制因子是 3。第一个数字是文件纯大小,第二个数字是带有 repicas 的文件大小。例如实际文件大小为 9.2 GB。因为复制因子是 3,所以带有副本的文件大小是 27.5GB
size disk space consumed with all replicas full_path
推荐阅读
- quarkus - 是否可以使用启用默认百分位数的千分尺夸库?
- javascript - Javascript按跨度标签拆分HTML字符串
- python - Discord Py bot 接收 DM 并将其转发到指定服务器
- excel - 尝试过滤单个列而不干扰其余列
- javascript - 反应:禁用右键单击videojs
- python - 在 Python 中使用 Pandas 确定奇偶值
- javascript - 不知道如何在本机反应中配置此文本颜色更改
- c# - 如何从音频文件路径获取 MediaFile 对象?
- c# - 如何在 C# 中创建 Linq AND 表达式?
- python - 如何忽略 --user 安装的库?