python - OCR Tesseract - 获取图像字体属性
问题描述
我一直在使用Pytesseract
从图像中提取文本。我目前正在进行图像文档的恢复任务。除了从图像中提取文本之外,我还想识别每个单词font
, ,font size
是否是character is capital or not
,等等。目前这可以用 Tesseract 实现吗?我已经阅读了Pytesseract的文档,但没有找到任何相关信息。如果这不可能,我该如何实现?是否有任何开源字体识别 API?谢谢。italicized or not
bold or not
解决方案
推荐阅读
- kotlin - 从 Facebook Graph-API 获取大型个人资料图片
- docker - 带有 Harbor 的 Docker 集线器缓存
- python - Pandas - 将字典键和值映射到新列
- tensorflow - 运行drums_rnn_train 在第一个检查点调用检查点侦听器时挂起
- c - 如何有效地对字符串使用 murmurhash 函数
- arrays - Perl:用seek函数不能指向启动?
- html - 在 HTML 元素中显示 PDF 时出现沙盒错误
- c# - 从菜单列表创建面包屑
- reactjs - 获取静态内容时如何防止不必要的渲染?
- c++ - 堆块在 C++ 中修改了过去的请求错误