首页 > 解决方案 > 用于数字液晶显示器的 Firebase MLkit 文本识别

问题描述

我正在尝试检测某些设备的数字 LED 显示屏上的文本,如下所示,需要帮助。我尝试了 Google 随 Firebase ML 套件提供的文本检测示例,但在设备(不是云)上表现不佳。帮助我了解如何优化设备模型的准确性。我正在寻找使用 ML 套件以正确方式执行此操作的建议,或者是否有任何其他比这更容易的替代方案,例如 OpenCV 等。

在此处输入图像描述

标签: androidfirebasetensorflowfirebase-mlkit

解决方案


如何优化设备模型的准确性?

不幸的是,您无法优化 ML Kit 中开箱即用的 API 模型的准确性。我们将更新模型以更好地识别这些图像。

还有其他选择吗?

除非有一个库可以达到您满意的水平,否则您将不得不训练自己的模型。您可能会从开源模型开始,并在没有太多数据的情况下为您自己的用例进行迁移学习。您可以查看Tensorflow-for-poets-2 代码实验室以获取有关如何执行此操作的快速教程。另一种选择是查看TF Hub以轻松重用现有模型。然后要将您的模型部署到设备上进行推理,请查看在 ML Kit中使用您自己的自定义模型。


推荐阅读