hadoop - HDP的HDFS复制过程真的很慢
问题描述
我目前正在同时使用CDH
和HDP
。我CDH
的系统的复制过程运行良好,但HDP
没有
例如:
当我将(20TB)中大目录的复制因子设置为
HDFS
2时,HDFS需要删除2 millions blocks
当我再次将上述目录的复制因子设置为 3 时,HDFS 将需要解析
2 millions under replicated blocks
在CDH
,我只花了3-5 小时或更短的时间完成,但HDP
花了我大约2 天。
我想提高HDP
.
我四处搜索,发现更改一些复制配置HDFS
可能会有所帮助。我还发现HDP
错过这些配置比较CDH
:
- dfs.namenode.replication.max-streams(默认:2,CDH:20)
- dfs.namenode.replication.max-streams-hard-limit(默认值:4,CDH:40)
- dfs.namenode.replication.work.multiplier.per.iteration(默认值:2,CDH:30)
HDP
我以类似的方式更改了上述配置,CDH
但没有运气。希望有人能帮忙!
解决方案
推荐阅读
- c# - 检查记录中发生更改后是否已过去一天
- php - 在 php while 循环中时,AJAX 表单不会发布表单值
- python - 如何在系统退出时优雅地停止 Kubernetes Watch on Services
- python - 在其他模块中时,类型别名中的 mypy 类前向引用会出错
- google-cloud-dataflow - 缓慢的数据流作业耗尽
- lotus-notes - 未找到类或类型名称 - 类型 Object
- opencv - 无法使用 OpenCV 检测到标记的正方形
- asp.net-mvc - ASP.NET MVC 自动注销并返回登录页面
- spring - 查询获取 Spring 中 MongoDb 的前 10 名用户
- python-3.x - 从 inceptionv3 的最后一个池化层中提取的特征是什么?