首页 > 解决方案 > ECS I/O 耗时过长

问题描述

我有一个在 t2.xlarge 上运行 2 个任务的 aws ecs 服务。该服务位于应用程序负载均衡器之后。

服务包含一个使用 gunicorn + uvicorn + fastapi(4 个工作人员)部署的 http api,它将大小为 112 * 112 * 3 的图像作为输入并使用 tf lite 模型进行预测。此处理时间不到 200 毫秒,而 API 的完整周转时间超过 12 秒。谁能建议如何改善这段时间?

标签: amazon-web-servicesgunicornamazon-ecsfastapi

解决方案


推荐阅读