首页 > 解决方案 > 使用 ruby​​ pdf-reader 解析 pdf

问题描述

我正在尝试使用 pdf-reader gem 解析 pdf。我已经探索了特定pdf页面的几种方法和显示方法显示正确的数据(即使表格列有不止一行,它也显示特定列的组合)但它给出的返回值为nil所以有什么方法可以获取此方法显示的值?我也尝试过使用文本方法,但问题是,在 pdf 中,我有类似结构的表格,一个表格列可以有不止一行,由于这个原因,文本方法没有按顺序显示值,所以它首先显示排然后是第二排等等。因此,判断哪个特定列有多于一行变得不难了。有什么办法可以解决这个问题吗?

reader = PDF::Reader.new(io)
reader.page(1).display #display methods print nice pdf data but return nil
reader.page(1).text #display pdf text but does not show value in order (in case of table)

标签: rubypdf-reader

解决方案


试试下面的代码怎么样

reader = PDF::Reader.new(io)
puts reader.page(1).display #display methods print nice pdf data but return nil
puts reader.page(1).text #display pdf text but does not show value in order (in case of table)

display方法只打印不返回。

如果你想看到任何结果。输入putsorp并尝试


推荐阅读