首页 > 解决方案 > 修复将 HTML 页面转换为 PDF 时的 PDF 可访问性问题(注释缺少替代描述)

问题描述

目前,我正在开发一个使用 iText 库将 html 页面转换为 PDF 的程序。

我正在使用的检查器是 PAC3 --> PDF Accessibility Checker 3,由以下链接 ( https://section508.gov/blog/check-pdf ) 描述。

其中一个问题是“注释缺少替代描述” 以下链接的摘录对此进行了解释:

注释缺少替代描述 这通常发生在链接不够清晰时。要修复此错误,请在链接标签中添加替代文本。要添加替代文本,请执行以下操作;

我一直在尝试使用 iText 来解决这个问题,但是谷歌搜索、查看源代码和阅读文档并没有帮助。

有人对如何编写 HTML 或使用 itext 问题来摆脱“注释缺少替代描述”有任何建议吗?

谢谢您的帮助

标签: htmlpdfitext

解决方案


您没有指定是使用旧代码 ( XMLWorker, HTMLWorker) 还是新 iText 代码 ( pdfHTML)。

这当然会影响建议的解决方案。

在我的回答中,我将假设您正在使用pdfHTML

有几种选择:

  • 使用 JSoup 之类的库编辑传入的 HTML
  • 将传入的 HTML 转换为 iTextIElement对象,并编辑它们,在需要的地方设置属性
  • 编写您自己的自定义TagWorker来处理特定标签的所有实例,并编写自定义逻辑来处理丢失的注释。

可以在此处找到自定义标签工作者的示例: https ://developers.itextpdf.com/content/itext-7-examples/converting-html-pdf/pdfhtml-custom-tagworker-example


推荐阅读