首页 > 解决方案 > 如何使用 python 打印 .pdf 文件中的表格

问题描述

CalledProcessError: 命令'['java', '-Dfile.encoding=UTF8', '-jar', 'C:\Users\vijv2c13136\AppData\Local\Continuum\anaconda2\lib\site-packages\tabula\tabula-1.0 .2-jar-with-dependencies.jar', '--pages', 'all', '--guess', '--format', 'JSON', 'TONY.pdf']' 返回非零退出状态 2

当我尝试打印 .pdf 文件中的表格时。它显示了这个特定的错误。

from tabula import wrapper

print(wrapper.read_pdf("TONY.pdf", multiple_tables=True,pages="all")

这是我的 .pdf 文件的表格提取代码。但是,当我尝试打印时,它会显示上述错误。

标签: pythonpdf-extraction

解决方案


在熊猫数据框中写入表格然后保存的一种方法。(甚至显示它)

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

fig, ax = plt.subplots()
fig.patch.set_visible(False)
ax.axis('off')
ax.axis('tight')

df = pd.DataFrame(np.random.randn(10, 4), columns=list('ABCD'))

ax.table(cellText=df.values, colLabels=df.columns, loc='center')

fig.tight_layout()

plt.show()

plt.savefig("tablepdf.pdf", bbox_inches='tight')

在此处输入图像描述


推荐阅读