首页 > 解决方案 > 解码PDF页面流(我不知道具体名称)

问题描述

我正在寻找如何解码 pdf 页面流(作为标题我不知道具体名称)。

看起来像这样

/OC /MC0 BDC ./Artifact <</O /Layout >>BDC .BT./CS0 cs 0.075 0.463 0.78  scn./GS0 gs./T1_0 1 Tf.18.75 0 0 18.75 40.1772 552.638 Tm.[(AF t)15(oolkit )]TJ.ET.EMC ./Artifact <</O /Layout >>BDC .BT./T1_1 1 Tf.18.75 0 0 18.75 140.6188 552.638 Tm.[(Det)15(ect, Pr)25(ot)15(ect a

我可以在 google 中找到一些关键字(BT、Tm 等)。但是,我找不到像 /OC、/MC0 BDC 这样的关键字...

那么,任何人都知道它如何适用于所有关键字?

谢谢。

标签: pdf

解决方案


您只需查找规范,即 ISO 32000。Adobe 在其网站上发布了第一个版本 ISO 32000-1:2008 的副本以供免费下载。在此副本中,ISO 页面标题已被替换(因此您可能不会将其用于审计等),但技术内容未受影响。只需谷歌搜索 PDF32000,目前它位于https://www.adobe.com/content/dam/acom/en/devnet/pdf/pdfs/PDF32000_2008.pdf但这可能不是永久链接。

但是请注意,您要查找的某些单词是在您的 pdf 本身中定义的名称。例如在你的

/OC /MC0 BDC
    ...
EMC

MC0是内容流资源中的任意名称,因此在谷歌上搜索该名称或在规范中搜索它无济于事。而是在此处搜索指令、BDCEMC,其解释将说明如何解释这些名称。

但实际上这个例子也说明了上面建议的一个例外,因为OC这个名字很特殊,所以搜索它会帮助你。

在此示例中,BDCEMC指令对包含标记的内容,此处用于定义可选内容(即OC名称),而名称MC0只是描述相关可选内容组的属性资源的名称。


推荐阅读