首页 > 解决方案 > 关于tensorflow服务性能提升的问题

问题描述

我们有一个用于模型服务的 tfs 集群。每个模型服务器加载大约 2 个模型。

我们注意到了一件有趣的事情。随着模型服务请求的 qps 从 150 增加到 200,每个模型服务器上的平均推理持续时间下降了 0.5 毫秒。

我对这个结果感到困惑,因为模型服务器没有配置“启用批处理”。为什么性能会越来越好。

期待有人能解答,谢谢~

标签: tensorflowtensorflow-serving

解决方案


推荐阅读