python - 如何在 Python 3 中安装 textract?
问题描述
我想从pdf中提取但pypdf2
没有提取所有信息并且textract
由于以下错误而无法在3.7中安装:
UnicodeDecodeError: 'charmap' codec can't decode byte 0x8d in position 1671: character maps to <undefined>
解决方案
从以下位置下载源文件
textract
:https ://pypi.python.org/pypi/textractpip3 install pdfminer3k
untar
下载的文件cd
进入目录跑:
python3 setup.py install
希望这对你有用:)
推荐阅读
- c# - 类未定义
- android - 在 Android 9.0 中未获取用户拨打的号码即使我在运行时也声明了读取通话记录和读取电话状态权限
- javascript - 扩展运算符会影响性能吗?
- html - 一种更简单的方法来编码这个 onclick 背景变化 - HTML/CSS
- java - 咖啡因缓存始终使用 getIfPresent 方法返回 null
- unit-testing - 在 VS2017 中以调试模式运行单元测试时出错
- c# - 带有 n+1 问题的 LINQ 查询
- excel - 尝试从 excel2016 向 access2016 表添加记录时出错
- python - 优化后评估 pyscipopt Expr
- neo4j - Set类型的可变深度持久性和关系