首页 > 解决方案 > 从上传的pdf中获取包含换行符的文本

问题描述

我目前正在开发一个小型网站,应该可以在该网站上上传 .pdf 文件。对于网站功能,我需要将 pdf 中的文本读入一个变量,包括换行符。例如,如果 pdf 中的文本是:

Hello World
How are you today?

那么变量中的文本应该是“Hello World\nHow are you today?”。

我已经尝试了几件事,但这些都不适合我。

HTML:

<input type="file" id="file" accept=".pdf">

我在我的 app.js 中尝试了以下代码:

function readPdf(){
    const file = document.getElementById('file').files[0];
    const reader = new FileReader();
    var output = "";
    reader.addEventListener("load", function () {
        output += reader.result;
    }, false);

    if (file) {
        reader.readAsBinaryString(file);
    }
    return output;
}

但这只是给了我一个象形文字字符串。

有没有人尝试过这样的事情并且可以告诉我它是如何完成的?

提前致谢

标签: javascriptpdf

解决方案


推荐阅读