首页 > 解决方案 > 有没有办法将大文本流分成 550 个字符的部分?

问题描述

我目前正在处理一个长度为 3,430,900 个字符的文件,全部包含在一个字符串中。我需要将此文本字符串拆分/拆分为 550 个字符段,以便每行有一个 550 个段。每个段都是相当标准的,但不幸的是,没有唯一的字符或序列可以使用“查找和替换”来添加回车或换行符。

这是我几天前提出的一个问题的后续,我确实得到了很好的答案。但现在我遇到了 Excel 的每个单元格 32,767 个字符的限制。我在想我可能需要使用 Excel 以外的东西。我有 notepad++ 和 Ultra Edit 但不确定他们是否能够执行此操作。

我可以对小于 32,767 个字符的文件使用以下公式

=MID(Sheet1!$A$1,(ROW(1:1)-1)*550+1,550)

但是任何更大的东西和 excel 都会在第 32,767 个字符之后自动拆分文件。

理想情况下,我想获得一个 .txt 文件,每行有一个 550 个字符的记录,我可以将其带入 Excel 进行进一步处理。

任何帮助将不胜感激!

标签: excelnotepad++line-breakscarriage-returnultraedit

解决方案


您可以在 Notepad++ 中以正则表达式模式尝试以下查找和替换:

Find:    .{550}
Replace: $0\r\n

这将找到每 550 个字符并替换为相同的 550 个字符,后跟一个换行符(我使用的是 Windows 换行符\r\n,但如果你在 Linux 上,你可以只使用\n)。


推荐阅读