首页 > 解决方案 > 读取 HDFS 上的特定块

问题描述

我有一个带有 1 个主节点和 3 个数据节点的 Hadoop 集群。我创建了一个 1G 文件,结果创建了 8 个位于不同数据节点中的块。我正在使用Amazon EMR,我可以使用此命令查看块的位置

hdfs fsck /1g.img -files -blocks -locations

但我需要阅读特定块的内容。我知道我可以使用该-cat选项,但这会读取我不需要的整个文件。有什么方法可以读取 hdfs 上特定块的内容,特别是在Amazon EMR上。

标签: amazon-web-serviceshadoophdfsamazon-emr

解决方案


推荐阅读