java - Tabula-Py 不工作 - 调用过程错误 - 非零退出状态 1
问题描述
我正在尝试使用 Tabula-py 从 PDF 中抓取一些数据,但是我无法让它完全正常工作。我在我的 Jupyter 笔记本(在 Mac 上)中运行它:
from tabula import read_pdf
df = read_pdf("/Users/jamesozden/Downloads/pdfminer-20140328/samples/simple1.pdf")
我收到了这个错误:
Error:
---------------------------------------------------------------------------
CalledProcessError Traceback (most recent call last)
<ipython-input-5-57f646d3a440> in <module>()
----> 1 df = read_pdf("/Users/jamesozden/Downloads/pdfminer-20140328/samples/simple1.pdf")
2 #/Users/jamesozden/Desktop/data_scrape_table.pdf
/Users/jamesozden/anaconda/lib/python2.7/site-packages/tabula/wrapper.pyc in read_pdf(input_path, output_format, encoding, java_options, pandas_options, multiple_tables, **kwargs)
83
84 try:
---> 85 output = subprocess.check_output(args)
86
87 except FileNotFoundError as e:
/Users/jamesozden/anaconda/lib/python2.7/subprocess.pyc in check_output(*popenargs, **kwargs)
217 if cmd is None:
218 cmd = popenargs[0]
--> 219 raise CalledProcessError(retcode, cmd, output=output)
220 return output
221
CalledProcessError: Command '['java', '-jar', '/Users/jamesozden/anaconda/lib/python2.7/site-packages/tabula/tabula-1.0.1-jar-with-dependencies.jar', '--pages', '1', '--guess', '/Users/jamesozden/Downloads/pdfminer-20140328/samples/simple1.pdf']' returned non-zero exit status 1
因此,我阅读了一些有关安装 java 的先前问题,我这样做了。我还确保我添加了我的 bash 配置文件的路径(我对此比较陌生,所以我不确定我是否做得正确)。这是我添加到我的 bash.profile 中的行,以防有人想确保它没问题,这是我从使用中得到的which java
:
export PATH="$HOME/usr/bin/java/bin:$PATH"
任何帮助将不胜感激,谢谢!
解决方案
我设法自己整理了!事实证明,即使我已经下载了 Java 的更新版本,使用的是 1.6 版(这个是使用 java -version 看到的)。我使用自制软件升级到 java 8,现在它工作正常。
推荐阅读
- typescript - getall 在 typescript 中使用 aws-sdk/lib-dynamodb
- mysql - Mysql 时区正确但时间提前 5 分钟。(亚洲/加尔各答)时区
- scala - org.apache.spark.sql.AnalysisException:在 SELECT 子句之外不支持生成器,但得到:'Agg
- opencv - 如何提高相机外参标定的准确性
- python-3.x - Inception v3 retraining with tensorflow 问题如何释放 retrained_graph.pb
- pandas - 如何将 3 列中的日期时间值合并为 pandas 数据框中的单列?
- angular - 如何在Angular中的可拖动包装列表中分配视图之间的剩余空间?
- nginx - 通过其他代理工作的 Nginx
- rest - .Net Framework 4.8 中的授权使用 OpenIdentity4 返回 Unauthorized
- python - 将 QR 解码解决方案从 Python 转换为 C# (EU DGC)