image-processing - 如何将工艺(用于文本检测的字符区域感知)的输出提供给 crnn
问题描述
我正在做文本检测和识别。我使用了 Craft(character-Region Awareness for text detection) https://github.com/clovaai/CRAFT-pytorch。它给了我一个带有边界框的图像输出和一个带有数字的文本文件。我想将输出提供给 CRNN https://github.com/bgshih/crnn。但我需要文本图像的 ROI 才能使 CRNN 工作。如何连接工艺和 CRNN
解决方案
我认为您需要为 CRNN 网络提供裁剪图像以识别字符。
简单的方法如下:
- 给一个图像
CRAFT_pytorch
- 通过输出的边界框结果裁剪并保存图像
CRAFT_pytorch
- 将裁剪后的图像
CRNN
作为输入
如果您同时调用两个函数CRAFT_pytorch
,CRNN
则可以跳过在第 2 阶段保存裁剪的图像。
推荐阅读
- vue.js - 在 $navigateBack 中传递更改的道具
- android - ChipGroup单选
- google-maps - SAP Fiori 无法在第一次视图调用时创建地理编码器构造函数
- php - 为什么在我的 PHP 链接中插入字符?
- grpc-java - 使用 gRPC - 在 Spring 或 Dropwizard 等框架之间进行选择
- java - 休眠将 2 个 java 文件链接到同一个数据库表
- ruby-on-rails - Rubymine:使用已安装的 Puma-dev 进行调试?
- hibernate - 休眠二级缓存的应用程序属性
- cassandra - 在 Cassandra 中对结果进行排序
- nlp - 使用 CoreNLP 将句子分割成子句