android - 用于数字液晶显示器的 Firebase MLkit 文本识别
问题描述
我正在尝试检测某些设备的数字 LED 显示屏上的文本,如下所示,需要帮助。我尝试了 Google 随 Firebase ML 套件提供的文本检测示例,但在设备(不是云)上表现不佳。帮助我了解如何优化设备模型的准确性。我正在寻找使用 ML 套件以正确方式执行此操作的建议,或者是否有任何其他比这更容易的替代方案,例如 OpenCV 等。
解决方案
如何优化设备模型的准确性?
不幸的是,您无法优化 ML Kit 中开箱即用的 API 模型的准确性。我们将更新模型以更好地识别这些图像。
还有其他选择吗?
除非有一个库可以达到您满意的水平,否则您将不得不训练自己的模型。您可能会从开源模型开始,并在没有太多数据的情况下为您自己的用例进行迁移学习。您可以查看Tensorflow-for-poets-2 代码实验室以获取有关如何执行此操作的快速教程。另一种选择是查看TF Hub以轻松重用现有模型。然后要将您的模型部署到设备上进行推理,请查看在 ML Kit中使用您自己的自定义模型。
推荐阅读
- facebook - How can I capture a URL from Chrome Custom Tabs without clicks?
- react-native - VirtualizedList:您有一个更新缓慢的大列表 - React Native FlatList
- java - 是否可以递归检查java数组中所有组合的最大值
- swift - 如何以表单数据格式将数据传递给服务器?我正在尝试发送以下 JSON 数据。我正在使用 Alamofire
- r - 如何使用 R 绘制世界地图
- php - Doctrine 查询语言每组的最新行
- javascript - 使用 javascript 替换 DOCX 中的合并字段
- r - 在 R 中,如何为二维扩展的矩阵创建动态矩阵索引?
- python - Python 请求“会话”对象没有属性“请求”
- ios - 我可以在没有许可证的情况下在商业 iOS 应用程序中使用 Helvetica 字体吗?