python - Celery '错误:没有节点在时间限制内回复'错误 - 如何调试?
问题描述
我之前遇到过多次出现的问题,但以前的答案似乎都没有帮助我。
我正在使用 Redis 后端运行 Celery(通过 Docker/Kubernetes)。我正在使用这个命令:
celery worker --uid 33 -A finimize_django --loglevel=DEBUG -E
(我刚刚将其设置为调试)
我正在使用celery==4.3.0
和redis==3.2.1
。
每当我跑步时,celery -A app_name status
我都会得到:
Error: No nodes replied within time constraint.
奇怪的是芹菜似乎工作正常。我可以看到正在处理的任务,即使我monitor
Redis 的东西似乎正在成功运行。几个月来,这在生产中也一直运行良好,只是上周才开始发生这种情况。
它导致了一个问题,因为我的活性探针因为这个错误消息而杀死了 pod。
如何调试潜在问题?日志输出中没有任何错误。
谢谢!
解决方案
我有同样的问题或至少非常相似。我已经设法通过固定kombu
到 version在我的项目中修复它4.6.3
。根据芹菜的 github 上的这个问题4.6.4
,这是. 调试的真正阴险的问题,但我希望这会有所帮助!