首页 > 解决方案 > 从谷歌幻灯片中收集文本

问题描述

是否有人尝试使用 R 将一个文件夹内的谷歌幻灯片中的所有文本收集到一大块文本中?我们正在尝试理解过去几年我们所有演示文稿中使用的语言和信息。一旦我们收集了所有文本,我们想尝试使用它来产生未来的见解。

标签: r

解决方案


解决此问题的最佳方法可能是将所有电源点下载为 pptx,然后遍历每个文件以读取每个 pptx。

您可以使用“officer”包阅读所有电源点并随时保存文本。

例子:

library(officer)

ppt_files = list.files(...\\ppt, pattern = ".ppt$", full.names = TRUE)


for (i in ppt_files){
ppt = pptx_summary(read_pptx(i))

### more code here

}

推荐阅读