r - 将多个 pdf 文件转换为 CSV 文件
问题描述
我的任务是将如下图 1 所示的所有 pdf 文件转换为单个 csv 文件。即 CSV 文件中的一行包含一个 pdf 文档。我使用下面的代码,我很挣扎。您的帮助和评论将不胜感激。
谢谢,
# Convert multiple pdf files to CSV files before mining
install.packages('pdftools')
install.packages('xlsx')
# Relevant libraries
library("pdftools")
library("xlsx")
#Set up a path
a<-"my path"
folder<-list.files(path=a,pattern="pdf",full.name=TRUE)
sapply(folder, FUN=function(i){
file.rename(from=i,to =paste0(dirname(i),
"/",gsub(" ","",basename(i))))})
folder1<-list.files(path=a,pattern="pdf",full.names=TRUE)
lapply(folder1, function(i) system(paste('"C:/Program
Files/xpdf/bin64/pdftotext.exe"', paste0('"', i, '"')), wait = FALSE) )
解决方案
推荐阅读
- bash - 如何在bash中求和倒数?
- azure - Azure EasyAuth:尝试使用 Microsoft 帐户登录时出现未经授权的错误
- javascript - 事件处理程序如何在 javascript 内部执行?
- sql - 具有多个表 SQL 的关联查询
- firebase - 对自定义电子邮件使用 Firebase 电子邮件验证
- javascript - 类中是否定义了 GET 或 SET
- node.js - 使用 brfs 时无法在 fs 函数中使用变量
- javascript - 更新 React Firestore 中嵌套数组中对象的值
- r - 在管道函数中应用函数时出错
- javascript - 如何根据用户选择更新模型上的属性?