首页 > 解决方案 > OCR Tesseract - 获取图像字体属性

问题描述

我一直在使用Pytesseract从图像中提取文本。我目前正在进行图像文档的恢复任务。除了从图像中提取文本之外,我还想识别每个单词font, ,font size是否是character is capital or not,等等。目前这可以用 Tesseract 实现吗?我已经阅读了Pytesseract的文档,但没有找到任何相关信息。如果这不可能,我该如何实现?是否有任何开源字体识别 API?谢谢。italicized or notbold or not

标签: pythonimageimage-processingtesseractpython-tesseract

解决方案


推荐阅读