首页 > 解决方案 > 如何将工艺(用于文本检测的字符区域感知)的输出提供给 crnn

问题描述

我正在做文本检测和识别。我使用了 Craft(character-Region Awareness for text detection) https://github.com/clovaai/CRAFT-pytorch。它给了我一个带有边界框的图像输出和一个带有数字的文本文件。我想将输出提供给 CRNN https://github.com/bgshih/crnn。但我需要文本图像的 ROI 才能使 CRNN 工作。如何连接工艺和 CRNN

标签: image-processingpytorchobject-detectionimage-recognitionfaster-rcnn

解决方案


我认为您需要为 CRNN 网络提供裁剪图像以识别字符。

简单的方法如下:

  1. 给一个图像CRAFT_pytorch
  2. 通过输出的边界框结果裁剪并保存图像CRAFT_pytorch
  3. 将裁剪后的图像CRNN作为输入

如果您同时调用两个函数CRAFT_pytorchCRNN则可以跳过在第 2 阶段保存裁剪的图像。


推荐阅读