performance - hadoop / YARN 如何判断一个节点速度很慢,以及它如何处理上面的任务?
问题描述
我相信我了解 HADOOP 如何知道节点已崩溃。如果集群管理器在预定时间内没有收到来自其中一个从属设备的心跳,那么它认为它已经死了。
集群管理器如何确定节点是否慢?一旦它确定节点很慢,它会如何处理该节点上的任务?
谢谢。
解决方案
回答我自己的问题。我正在使用 Tom White 的以下参考资料“ Hadoop:权威指南”。
哈罗德是正确的。根据本书,应用程序启动的任务会定期向应用程序主控报告状态。如果应用程序主控发现某个任务没有报告进度,它会假定该任务处于挂起状态并自动终止相应的 JVM。默认超时时间为 10 分钟。
什么构成进步是书中也包含的单独讨论。
推荐阅读
- bash - 使用 bash、Azure CLI 和 REST API 访问 CosmosDB - 如何正确获取令牌和哈希?
- python - 使用正则表达式或模式匹配将字符串规则转换为 python 中的数据框
- reactjs - 将用户导航到传单地图中加载的 geojson 对象
- machine-learning - Lasso 或 Ridge 选择了哪些类型的变量?
- machine-learning - CNN 模型的损失不收敛
- c# - 在 .net core 3.1.1 Web 应用程序中更改 AzureAD 身份验证的 redirectURI 和 CallbackPath
- sql-server - 了解导致死锁的锁定行为
- c++ - 如何在没有解释的情况下修复 C++ 链接器错误
- php - laravel foreach 和 if else 在计数和变量中循环错误
- video - yuv420p10le(tv) 格式的位打包