首页 > 解决方案 > 从 pdf 页面捕获屏幕截图

问题描述

我有一个 pdf 文档,这个页面有一个图表的图像,但是该图的图例不是图像的一部分。我正在使用 pymupdf 提取此图像,如下所示:

  for img in doc.getPageImageList(page_num, full=True):
    xref = img[0]
    pix = fitz.Pixmap(doc, xref)
    if pix.n - pix.alpha < 4:  # this is GRAY or RGB
      pix.writePNG(basePath+"/test_data/"+fund_type+"/%s-%s.png" % (filename+str(page_num), xref))
      print(filename + ' : ' + basePath + "/test_data/" + fund_type+ '/'+filename+ str(page_num) + '-'+str(xref), file=f)

现在,这给了我图像(图表)。我希望能够在图像下方捕获一些高度,以便将图例也捕获为图像的一部分。这可能使用pymupdf吗?任何代码指针也会有所帮助。

标签: pythonpymupdf

解决方案


推荐阅读