hadoop - 格式化hdfs上的namenode后如何格式化datanodes?
问题描述
我最近在伪分布式模式下设置了hadoop,我已经创建了数据并将其加载到 HDFS 中。后来我因为一个问题格式化了namenode。现在,当我这样做时,我发现数据节点上之前已经存在的目录和文件不再显示。(虽然“格式化”这个词是有道理的)但是现在,我确实有这个疑问。由于 namenode 不再保存文件的元数据,对先前加载的文件的访问是否被切断?如果是,那么我们如何删除数据节点上已经存在的数据?
解决方案
您以前的数据节点目录现在已经过时了,是的。
您需要手动浏览每个数据节点并删除这些目录的内容。Hadoop CLI 没有这样的格式命令
默认情况下,数据节点目录是/tmp下的单个文件夹
否则,您已经配置了存储数据的 XML 文件
推荐阅读
- javascript - myFunction 未在 Javascript 中定义
- python - 我有一个字节数组的字符串表示,但我需要原始字节表示
- python - 根据数组索引绘制 y 坐标的二维数组
- python - 如何使用 Telethon 将图像下载到我的本地 PC
- kotlin - 使用 Room 自动生成主键不起作用
- c - C程序显示罗马数字直到n
- python - 使用python查找列表给定部分中最大数字的索引
- javascript - 如何设置 VueJS 路由和 NodeJS Express API 路由?
- node.js - 使用JS在mongo中复合搜索条件
- html - 我可以使用 CSS 将基本表单输入字段更改为多行文本输入字段吗?