首页 > 解决方案 > 如何使用正则表达式将文本拆分为块,在特定字符上断开?

问题描述

  1. 我希望将长文本分成最多 1000 个字符的块,
  2. 为了在每个块中尽可能多地使用字符,但重要的是我想在换行符中完成每个块,以避免中间的单词分裂。
  3. 如果在所有 1000 个字符中都没有单个换行符,那么我的正则表达式仍将捕获并将一个单词分成 2 个块。

此正则表达式/.{1,1000}/gs会将文本拆分为 1000 个字符的块,但它可能会在中间打断一个单词。

什么正则表达式会给我想要的结果?

标签: regex

解决方案


您可以使用.{1,1000}\bwhich 将在第 1000 个字符之前拆分到单词边界


推荐阅读