首页 > 解决方案 > 如何使 ActivePDF WebGrabber 为正文部分的长文本正确分解页面

问题描述

ActivePDF WebGrabber 用于将 HTML 内容转换为包含页眉、正文和页脚的 PDF。每个部分都是一个完整的 HTML 文档,并作为 API 中的参数值提供给 WebGrabber。

当正文部分较长时,通常包含在 HTML 文档中的单个 <p>、<div> 或 <td> 元素中,生成的 PDF 文件将是多页,有时分页符会切掉最后一行将正文文本水平放置在页脚正上方的页面底部,并将文本行的上部放在它剪切的页面上,将文本行的下部放在下一页上,作为起始行身体部分。

也就是说,这是一个断行问题,由于不可预知,断行的位置可以在长文本中的任意位置,即使是一行字符串或句子,也会导致整行被砍头。

看起来固定页脚与超出正文部分的最后一行重叠。

ActivePDF 网站提供了长行分页问题的解决方案,如在文本保持器元素上使用“page-break-inside:avoid”CSS 样式,但它不起作用,或者适用于正文部分的超长文本。

我将不胜感激任何帮助或建议。

PS 我尝试将 API 参数设置为页面宽度、页面高度、fixPageSize 和页眉和页脚的固定高度,它们没有任何区别。PDF文件用于报告,因此正文部分相对动态。

PS我把长文本分成了许多<div>,它们的样式是“break-inside:避免!important”,现在WebGrabber为每个<div>生成一个页面。这是 WebGrabber 对 CSS 样式“page-break-inside”或“break-inside”设置的第一反应,虽然是错误的。

标签: htmlpdfsplitpage-breakwebgrabber

解决方案


推荐阅读