ruby - 使用 ruby pdf-reader 解析 pdf
问题描述
我正在尝试使用 pdf-reader gem 解析 pdf。我已经探索了特定pdf页面的几种方法和显示方法显示正确的数据(即使表格列有不止一行,它也显示特定列的组合)但它给出的返回值为nil所以有什么方法可以获取此方法显示的值?我也尝试过使用文本方法,但问题是,在 pdf 中,我有类似结构的表格,一个表格列可以有不止一行,由于这个原因,文本方法没有按顺序显示值,所以它首先显示排然后是第二排等等。因此,判断哪个特定列有多于一行变得不难了。有什么办法可以解决这个问题吗?
reader = PDF::Reader.new(io)
reader.page(1).display #display methods print nice pdf data but return nil
reader.page(1).text #display pdf text but does not show value in order (in case of table)
解决方案
试试下面的代码怎么样
reader = PDF::Reader.new(io)
puts reader.page(1).display #display methods print nice pdf data but return nil
puts reader.page(1).text #display pdf text but does not show value in order (in case of table)
display
方法只打印不返回。
如果你想看到任何结果。输入puts
orp
并尝试
推荐阅读
- linux - /usr/local/ 为 Azure 规模集上的自定义 centos7 图像重置
- reactjs - 代码:'ERR_UNHANDLED_REJECTION' 开玩笑反应测试
- xamarin - 为什么我的 IsVisible 绑定不适用于 StackLayout ?Xamarin iOS
- xamarin.forms - xamarin 形成 UWP 应用程序 - 如何创建一个在概念上看起来/感觉类似于 MS Word 的“打开文件”对话框?
- css - 如何让 NuxtJS/Vuetify 组件占据其父容器的百分比?
- firebase - Update Firestore with user last active date
- sql - Group questions by answers with SQL
- flutter - Flutter and BoxShapeBorder
- python - Python: convert csv file to list of tuples
- ffmpeg - 从使用单播的 udp 流制作屏幕截图