python - 如何使用 python 打印 .pdf 文件中的表格
问题描述
CalledProcessError: 命令'['java', '-Dfile.encoding=UTF8', '-jar', 'C:\Users\vijv2c13136\AppData\Local\Continuum\anaconda2\lib\site-packages\tabula\tabula-1.0 .2-jar-with-dependencies.jar', '--pages', 'all', '--guess', '--format', 'JSON', 'TONY.pdf']' 返回非零退出状态 2
当我尝试打印 .pdf 文件中的表格时。它显示了这个特定的错误。
from tabula import wrapper
print(wrapper.read_pdf("TONY.pdf", multiple_tables=True,pages="all")
这是我的 .pdf 文件的表格提取代码。但是,当我尝试打印时,它会显示上述错误。
解决方案
在熊猫数据框中写入表格然后保存的一种方法。(甚至显示它)
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
fig, ax = plt.subplots()
fig.patch.set_visible(False)
ax.axis('off')
ax.axis('tight')
df = pd.DataFrame(np.random.randn(10, 4), columns=list('ABCD'))
ax.table(cellText=df.values, colLabels=df.columns, loc='center')
fig.tight_layout()
plt.show()
plt.savefig("tablepdf.pdf", bbox_inches='tight')
推荐阅读
- end-to-end-encryption - 如何在 EE2E 中读取来自另一台设备的消息
- linux - 遍历数组以在 Bash 中搜索多个元素
- perl - Perl (MQSeries):如何使用 TLS 连接到 WMQ 的通道(“相同的代码”在 C++ 中工作)
- nestjs - NestJs:如何将一个存储库导入另一个存储库?
- botframework - BotFramework - strictFilters 过滤 QnAMaker 结果
- wpf - 带有嵌套 ListView 双击事件的 ListView 触发两次
- windows - 在 Windows CMD 命令中关闭两个单独的任务列表文本文件中找不到的应用程序
- python - 在 matplotlib 中绘制可变数量的子图的函数
- python-2.7 - Spyder 4.1 3 从 python 3 更改为 python 2
- sql-server - 如果不存在,则为每个时间增量返回一行