首页 > 解决方案 > 提高基于 Tabula 的 API 的响应时间

问题描述

我开发了一个 API 来解析 PDF 中的数据。我使用 tabula-py 来开发这个 API,但在 localhost 上需要 4-5 秒,这要长得多。为了减少响应时间,我想使用 Azure-Function,但它比 localhost(9-10 秒)花费的时间要长得多,这是意料之中的。

为了部署它,我使用了 docker 镜像(Azure 的 ACR),我认为它可以帮助我提高可扩展性。任何人都可以建议我减少响应时间的可能方法吗?为什么在 Azure Function 中需要这么长的时间(这是意料之外的)?

PS Azure Function 与 AWS Lambda 类似。

标签: pythonamazon-web-servicesazuretabulatabula-py

解决方案


tabula-py是一个包装器tabula-java,它是用 Java 编写的。您看到的延迟是 Java 虚拟机的启动时间,它由 Python 包装器启动。

最佳解决方案是使用在 JVM 中运行的语言(如 Java 或 Kotlin)构建 API 服务器。


推荐阅读