首页 > 解决方案 > 从网站读取文件并将它们加载到对象中而不下载文件

问题描述

我正在尝试通过将网站中存在的文件直接加载到对象中来从网站读取文件(例如:如果站点中有 PDF 文件,我将其直接加载到 PdfBox 对象中)。同样,我正在尝试使用 Apache POI 处理 MS Office 文件,但它会引发异常(java.io.IOException:无法读取 zip 条目源并由以下原因引起:java.io.EOFException:ZLIB 输入流的意外结束)。解决上述问题的任何建议或满足我要求的任何其他方式都会有所帮助。

        String docx = "http://support.skillscommons.org/documentation/SkillsCommons-Accessibility-Checkpoints-Guide.docx";
        BufferedInputStream in = new BufferedInputStream(new URL(docx).openStream());
        if(in != null) {
             XWPFDocument wDoc = new XWPFDocument(OPCPackage.open(in));
                if(wDoc != null) {
                    System.out.println(wDoc.getParagraphs().size());
                }
            System.out.println(input);
        }

标签: javastreamapache-poims-office

解决方案


推荐阅读