pdf - 如何从pdf文档中读取数据并插入数据库?
问题描述
我从客户那里得到了 PDF 文件。该文件长达 60 页。我需要从第 49 页中间到第 58 页读取数据。在 ColdFusion 中,有一个cfpdf
标签可以读取 pdf 文档。这是我到目前为止的示例:
<cftry>
<cfset mypdf = expandPath("./data.pdf")>
<cfpdf action="read" source="#mypdf#" name="PDFInfo">
<cfdump var="#PDFInfo#">
<cfcatch type="any">
<cfdump var="#cfcatch#">
</cfcatch>
</cftry>
将文档转储到屏幕上后,会显示以下信息:
Author [empty string]
CenterWindowOnScreen no
ChangingDocument Allowed
Commenting Allowed
ContentExtraction Allowed
CopyContent Allowed
PageSizes
PDFDocumentarray
1
PDFDocument - struct
height 792
width 612
2
PDFDocument - struct
height 792
width 612
3
PDFDocument - struct
height 792
width 612
4
PDFDocument - struct
height 792
width 612
我以前从未使用过 cfpdf,这对我来说是新事物。我试图在网上搜索,但找不到有关如何从 PDF 文档中获取数据的示例。有没有一种从文件/文档中特定页面获取数据的好方法?另外我猜必须有一个允许访问单个行数据的循环。如果有人对此问题有很好的资源示例,请告诉我。谢谢。
解决方案
推荐阅读
- javascript - 在 React js 中渲染嵌套的 json 数据
- spring-boot - 在 AWS Fargate 上使用 HTTPS 的 Spring Boot 应用程序
- css - CSS calc() 函数不分配负数
- x86 - puts@@GLIBC_2.2.5 在什么库中
- python - python 3.8中的singledispatchmethod和类方法装饰器
- ubuntu - Nginx 不显示 ServerBlocks
- spring-boot - 在 Spring Boot 中禁用 CSRF 的原因
- node.js - Monkey 修补节点 js bunyan 日志记录
- python - 如何打印在任何行中找不到的值?
- azure - 使用 .NET SDK 获取给定 Azure 区域中的所有可用 Kubernetes 版本