python - 从 pdf 页面捕获屏幕截图
问题描述
我有一个 pdf 文档,这个页面有一个图表的图像,但是该图的图例不是图像的一部分。我正在使用 pymupdf 提取此图像,如下所示:
for img in doc.getPageImageList(page_num, full=True):
xref = img[0]
pix = fitz.Pixmap(doc, xref)
if pix.n - pix.alpha < 4: # this is GRAY or RGB
pix.writePNG(basePath+"/test_data/"+fund_type+"/%s-%s.png" % (filename+str(page_num), xref))
print(filename + ' : ' + basePath + "/test_data/" + fund_type+ '/'+filename+ str(page_num) + '-'+str(xref), file=f)
现在,这给了我图像(图表)。我希望能够在图像下方捕获一些高度,以便将图例也捕获为图像的一部分。这可能使用pymupdf吗?任何代码指针也会有所帮助。
解决方案
推荐阅读
- npm - 如何将 CLI 工作区和其他文件添加到现有的 Angular 5 项目?
- cassandra - 从 python 脚本从 CCM 节点读取大量数据导致节点关闭
- c# - 如何使日期范围的自定义 ValidationAttribute 工作
- javascript - React JS - 在数组末尾停止无限滚动
- docker - 使用 ssl_verify_client 时,我收到“未发送所需的 SSL 证书”
- org-mode - 如何更改 Spacemacs 中的组织模式表背景颜色?
- javascript - Firebase 安全规则为 Firestore .where() 快照引发错误
- c - 无法理解程序头和节头中的偏移成员
- python - 在两个关键字之间打印单词
- reactjs - 元标记服务器端渲染