首页 > 解决方案 > 将非常大的内容放入字符串或字符串构建器中

问题描述

我想获取一个非常大的 html 页面,但是当我尝试使用 jsoup 解析页面时,它报告了很多错误,因为页面太大了。

我还将此页面保存为文本文件(生成 225mb 文件),但文件太大,超出了 String 和 StringBuilder 的 2147483647 个字符限制。

我该如何处理这么大的字符串?

标签: java

解决方案


下载文件并将其保存在本地。然后使用缓冲文件读取器逐行读取文件并进行处理。考虑到它的大小,将整个文件读入一个字符串似乎是个坏主意,而且您仍然无法有效地分析数据。


推荐阅读