regex - 如何使用正则表达式将文本拆分为块,在特定字符上断开?
问题描述
- 我希望将长文本分成最多 1000 个字符的块,
- 为了在每个块中尽可能多地使用字符,但重要的是我想在换行符中完成每个块,以避免中间的单词分裂。
- 如果在所有 1000 个字符中都没有单个换行符,那么我的正则表达式仍将捕获并将一个单词分成 2 个块。
此正则表达式/.{1,1000}/gs
会将文本拆分为 1000 个字符的块,但它可能会在中间打断一个单词。
什么正则表达式会给我想要的结果?
解决方案
您可以使用.{1,1000}\b
which 将在第 1000 个字符之前拆分到单词边界
推荐阅读
- android - 如何在 SdkVersion 30 上更改 systemUIVisibility
- javascript - 谷歌驱动 API 和 javascript
- python-3.x - 在 Pandas DataFrame 的每一行中添加具有最流行字符串值的新列
- kubernetes - k3d 负载均衡器类型的服务没有外部 IP
- java - 使用自定义对象填充微调器。如何在自定义对象中设置微调器提示
- java - Tomcat中rest api的客户端身份验证
- python - 在使用递归的多重嵌套 for 循环的程序中找不到故障
- aws-lambda - 动态 Access-Control-Allow-Origin 标头无服务器
- python - 将 PDF 解析为 CSV
- javascript - 我如何使用 forEach 循环遍历这个