python - python中pdf文件中图像的文本识别
问题描述
我正在尝试从包含文档扫描图像的 pdf 文件中提取一些信息。我想在该 pdf 文件上运行文本识别而不将 pdf 页面转换为图像,因为它不适用于我正在尝试做的事情。
那么是否可以直接在python中的pdf文件上运行文本识别?
解决方案
推荐阅读
- woocommerce - 添加自定义字段未显示在 woocommerce 的感谢页面帐单地址部分
- javascript - 如何根据使用 jQuery 的行检查复选框?
- css - 如何在不使用的情况下在行内元素之间添加空格
- java - 我的 sonarqube 总是说 Java 没有代码覆盖率
- ruby-on-rails - 没有路线匹配 [GET] "/auth/github"
- python - Python docx:从 docx 为表格设置“首选宽度”
- java - 越界错误,同时读取文件然后拆分它
- enterprise-architect - 我们如何在 Enterprise Architect 中导出 DMN
- node.js - 如何使用 NodeJs SDK 访问 RA-GRS 中的 Azure 表存储二级存储
- http - HTTP 如何保证分块响应可以按顺序接收?