java - 非拉丁文本从 pdf 文本字段中消失
问题描述
itext 7.1.9
我使用库创建了一个带有文本可填写字段的 PDF 文档。PdfTextFormField
包含多语言文本。创建 PDF 文档后,我在 Adobe Acrobat Reader 中打开它,非拉丁符号从文本字段中消失,我只看到拉丁符号,但如果我点击该字段,整个文本将可见,包括非拉丁符号。[!打开文档后的PDF文本域] 1.[!点击该字段后的PDF文本字段] 2.为了创建 PDF 文档,我使用如下代码:
public class Main {
public static void main(String[] args) throws IOException, URISyntaxException {
FontProviderAndFormFieldExample app = new FontProviderAndFormFieldExample();
app.createPdf("Test1.pdf");
app.fillExample("Test1.pdf", "Result.pdf", Paths.get(Main.class.getResource("/fonts").toURI()).toString());
}
public static class FontProviderAndFormFieldExample {
public String FIELDNAME = "test";
public Rectangle FIELDRECT = new Rectangle(50,300,300,20);
public String FIELDVALUE = "ПриветHello";
public void createPdf(String dest) throws IOException {
PdfWriter writer = new PdfWriter(dest);
PdfDocument pdfDoc = new PdfDocument(writer);
Document doc = new Document(pdfDoc);
Paragraph para = new Paragraph("Test document for multi-font appearance in a text formfield");
doc.add(para);
PdfAcroForm acroForm = PdfAcroForm.getAcroForm(pdfDoc,true);
PdfTextFormField ff = PdfFormField.createText(pdfDoc,FIELDRECT,"test", FIELDVALUE);
ff.setMultiline(true);
ff.setScroll(true);
acroForm.addField(ff,pdfDoc.getFirstPage());
PdfCanvas pdfCanvas = new PdfCanvas(pdfDoc.getFirstPage());
pdfCanvas.setLineWidth(1f).setStrokeColor(ColorConstants.BLUE).rectangle(FIELDRECT).stroke();
doc.close();
}
public void fillExample(String src, String dest, String srcf) throws IOException, URISyntaxException {
PdfReader reader = new PdfReader(src);
PdfWriter writer = new PdfWriter(dest);
PdfDocument pdfDoc = new PdfDocument(reader,writer);
PdfAcroForm acroForm = PdfAcroForm.getAcroForm(pdfDoc,true);
PdfFormField ff = acroForm.getField(FIELDNAME);
String filename = Main.class.getResource("/fonts/arial unicode.ttf").toURI().toString();
final PdfFont font = PdfFontFactory.createFont(filename, PdfEncodings.UTF8, false);
ff.setFont(font).setValue(FIELDVALUE);
pdfDoc.close();
}
}
}
我试图解决这个问题,我什至在 itext 博客上找到了这篇文章,但它对我没有帮助。我知道使用ff.setNeedAppearence(true)
方法,但我不能使用它,因为它破坏了我应用程序的另一部分。而且我无法设置PdfEncoding.IDENTITY_H
,因为它仅嵌入了以编程方式包含在字段中的符号子集,并且用户无法填写此字段。
谁能帮我?我做错了什么?
解决方案
要确保嵌入完整字体,而不仅仅是子集,请使用font.setSubset(false);
.
一般来说,您应该尽可能尝试使用包含您的值中所有字形的字体。否则,您的 PDF 的使用者可能会遇到问题。
作为一种解决方法,您可以使用自动选择适当字体layout
的功能使用模块创建自己的外观。FontSet
在我的示例中,我只添加了一种字体,FontSet
但您可以在那里添加多种字体。但是,强烈建议将字体数量限制为一种,如果不可能,则限制为尽可能少的数量。
所以在这里我们基本上创建了一个PdfFormXObject
作为我们的外观对象:
FontSet fontSet = new FontSet();
fontSet.addFont("C:/Windows/Fonts/arial.ttf");
FontProvider fontProvider = new FontProvider(fontSet);
PdfFormXObject xObject = new PdfFormXObject(FIELDRECT);
Canvas canvas = new Canvas(xObject, pdfDoc);
canvas.setProperty(Property.FONT_PROVIDER, fontProvider);
canvas.add(new Paragraph(FIELDVALUE).setMultipliedLeading(1).setFontFamily("Arial"));
然后我们必须将其设置为字段:
ff.setAppearance(PdfName.N, null, xObject.getPdfObject());
您现在的完整代码createPdf
如下所示:
PdfWriter writer = new PdfWriter(dest);
PdfDocument pdfDoc = new PdfDocument(writer);
Document doc = new Document(pdfDoc);
Paragraph para = new Paragraph("Test document for multi-font appearance in a text formfield");
doc.add(para);
PdfAcroForm acroForm = PdfAcroForm.getAcroForm(pdfDoc,true);
PdfTextFormField ff = PdfFormField.createText(pdfDoc,FIELDRECT,"test", FIELDVALUE);
ff.setMultiline(true);
ff.setScroll(true);
FontSet fontSet = new FontSet();
fontSet.addFont("C:/Windows/Fonts/arial.ttf");
FontProvider fontProvider = new FontProvider(fontSet);
PdfFormXObject xObject = new PdfFormXObject(FIELDRECT);
Canvas canvas = new Canvas(xObject, pdfDoc);
canvas.setProperty(Property.FONT_PROVIDER, fontProvider);
canvas.add(new Paragraph(FIELDVALUE).setMultipliedLeading(1).setFontFamily("Arial"));
ff.setAppearance(PdfName.N, null, xObject.getPdfObject());
acroForm.addField(ff,pdfDoc.getFirstPage());
PdfCanvas pdfCanvas = new PdfCanvas(pdfDoc.getFirstPage());
pdfCanvas.setLineWidth(1f).setStrokeColor(ColorConstants.BLUE).rectangle(FIELDRECT).stroke();
doc.close();
打开 PDF 的视觉结果:
UPD上面的代码在 Adobe Acrobat、Foxit、Chrome PDF 查看器中运行良好,但是当您在 Adobe Reader 中打开它时,您会看到空白的表单字段。
要使其在 Acrobat 中工作,您必须确保您的 XObject bbox 从原点开始:
PdfFormXObject xObject = new PdfFormXObject(new Rectangle(0, 0, FIELDRECT.getWidth(), FIELDRECT.getHeight()));
并且还将外观包装到/Tx BMC
/EMC
块中,该块标记了外观重新生成时需要替换的部分。
修复部分代码在 Adobe Acrobat Reader 中也能产生正确的结果:
PdfFormXObject xObject = new PdfFormXObject(new Rectangle(0, 0, FIELDRECT.getWidth(), FIELDRECT.getHeight()));
Canvas canvas = new Canvas(xObject, pdfDoc);
canvas.getPdfCanvas().beginMarkedContent(new PdfName("Tx"));
canvas.setProperty(Property.FONT_PROVIDER, fontProvider);
canvas.add(new Paragraph(FIELDVALUE).setMultipliedLeading(1).setFontFamily("Arial"));
canvas.getPdfCanvas().endMarkedContent();
推荐阅读
- informatica-powercenter - 在参数文件中设置参数并在同一工作流程中使用
- gradle - 使用 Gradle Kotlin DSL 构建源 jar?
- ms-access - 在 Access VBA 中,如何将自定义命名文件附加到 Outlook?
- python - 获取要删除的行的索引,其中两列为零
- ruby-on-rails - 是否可以将参数传递到模态窗口?需要模态来引用对象
- image - 如何在 Vich Uploader 中提交表单之前显示图像缩略图?
- spring - 模拟原型作用域bean
- shell - 用grep和wc同时过滤和统计结果
- django - Django模型到字段
- windows - 固定的 Windows Git Bash 任务栏图标不尊重 git-bash.exe 快捷方式启动目录