首页 > 解决方案 > Hadoop集群中u0X目录的作用是什么?

问题描述

我是 Hadoop 和 Linux 的新手。我正在按照教程构建一个简单的 3 节点集群,在成功安装伪分布式集群后,我现在需要将其重新配置为完全分布式。

我到了需要为 fsimage 文件提供冗余的地步。所以根据教程我需要以hdfs-site.xml这种方式编辑:

当前设置(伪分布式)

<property>
   <name>dfs.namenode.name.dir</name>
   <value>file:/hadoop/hdfs/namenode</value>
</property>

更改为(完全分布式)

<property>
  <name>dfs.namenode.name.dir</name>
  <value>file:///u01/dfs/namenode,file:///u02/dfs/namenode</value>
</property>

这看起来很简单,但对于一个新的 linux 用户来说,它提出了一个问号。

u01和的含义是u02什么?这些只是我需要创建的新目录吗?是否有任何与它们相关的隐式配置?教程没有提供更多信息,所以我猜我缺乏一些常识。我应该只创建目录,修改 xml 文件并继续前进吗?

任何关于什么是uXX一般目录以及它如何与 Hadoop 集群相关的解释都将不胜感激。

标签: hadoophdfs

解决方案


该属性dfs.namenode.name.dir确定本地文件系统中 HDFS 名称节点必须存储持久 HDFS 元数据(fsimage 和编辑)的位置。此属性的值需要至少一个目录路径。

如果您提供一个逗号分隔的目录路径列表,namenode 将尝试在所有这些路径中复制相同的元数据。它仅用于冗余。

目录路径可以是任何结构,只要运行 namenode 进程的用户可以访问它们。这里uXX纯粹是为了区分它们是不同的目录路径。

除了本地 FS 之外,此属性还接受远程(如 NFS)文件系统目录路径。


推荐阅读