pdf - 解码PDF页面流(我不知道具体名称)
问题描述
我正在寻找如何解码 pdf 页面流(作为标题我不知道具体名称)。
看起来像这样
/OC /MC0 BDC ./Artifact <</O /Layout >>BDC .BT./CS0 cs 0.075 0.463 0.78 scn./GS0 gs./T1_0 1 Tf.18.75 0 0 18.75 40.1772 552.638 Tm.[(AF t)15(oolkit )]TJ.ET.EMC ./Artifact <</O /Layout >>BDC .BT./T1_1 1 Tf.18.75 0 0 18.75 140.6188 552.638 Tm.[(Det)15(ect, Pr)25(ot)15(ect a
我可以在 google 中找到一些关键字(BT、Tm 等)。但是,我找不到像 /OC、/MC0 BDC 这样的关键字...
那么,任何人都知道它如何适用于所有关键字?
谢谢。
解决方案
您只需查找规范,即 ISO 32000。Adobe 在其网站上发布了第一个版本 ISO 32000-1:2008 的副本以供免费下载。在此副本中,ISO 页面标题已被替换(因此您可能不会将其用于审计等),但技术内容未受影响。只需谷歌搜索 PDF32000,目前它位于https://www.adobe.com/content/dam/acom/en/devnet/pdf/pdfs/PDF32000_2008.pdf但这可能不是永久链接。
但是请注意,您要查找的某些单词是在您的 pdf 本身中定义的名称。例如在你的
/OC /MC0 BDC
...
EMC
MC0是内容流资源中的任意名称,因此在谷歌上搜索该名称或在规范中搜索它无济于事。而是在此处搜索指令、BDC和EMC,其解释将说明如何解释这些名称。
但实际上这个例子也说明了上面建议的一个例外,因为OC这个名字很特殊,所以搜索它会帮助你。
在此示例中,BDC和EMC指令对包含标记的内容,此处用于定义可选内容(即OC名称),而名称MC0只是描述相关可选内容组的属性资源的名称。
推荐阅读
- css - CSS“绝对”定位:没有非静态祖先时的行为是什么?
- c# - HttpWebRequest Post to Oracle Service Connection 被强行关闭
- reactjs - ReactJs 从选择列表更新状态
- java - Camel POST RestService 接受 JSONArray :注释和解析错误
- scala - 在多个构建中加载资源时出现问题
- php - 使用包含传递变量?
- node.js - 尝试将数据从 react.js 发布到 node.js 但似乎不起作用
- mysql - 我无法创建视图
- javascript - d3.js 可见性区域计算或如何绘制地理矩形
- python - Python DateTime 索引 - 无法删除日期 - ValueError:无法将字符串转换为时间戳