pdfbox - pdfbox中的PDFDebugger锁定查看页面内容流
问题描述
我有一个奇怪的 PDF,它似乎将图像数据直接编码到内容流中,而不是作为资源隐藏起来(资源中有图像,但由于某种原因它们实际上不在页面中)。实际页面的内容长度非常大(107,988,275)。
它正在杀死我们的服务器,所以我想我会打开 PDFDebugger 以查看内容流中的内容。当我打开 PDF 并导航到内容流时,它会完全锁定。我尝试增加堆大小(4g),但似乎没有帮助。
有没有办法只查看流的头部?我真的很想知道这东西里有什么。有没有办法将图像数据直接编码到页面的内容流中?
解决方案
正如 Tilman 在评论中建议的那样,您可以通过将 PDPage.getContents() 给出的 InputStream 写入文件来查看内容流。
推荐阅读
- google-apps-script - 通过应用程序脚本在 Google 表格中引用查询公式的单元格值似乎不起作用
- sql-server - 哪些措施应纳入事实表 (SSMS)
- reactjs - Apollo `subscribeToMore` 变量是否必须与初始查询匹配?
- python - 递归调用方法变量python
- java - Hibernate 不会自己创建 Join Table
- java - 得到一个格式错误的 url 异常,说有协议时没有协议
- java - Android 应用程序在尝试播放媒体时关闭
- php - PHP exec() 从 CMD 编译 VB6
- c++ - 获取地图数组的长度
- python - Pyqt - 在“IconMode”中添加到 QTreeViewItem 时,自定义小部件上的选择突出显示丢失