regex - 如何在文本文件中查找和替换框字符?
问题描述
我有一个大文本文件,我将通过编程方式处理它,但遇到了散布在整个文件中的特殊字符的问题。该文件太大,无法扫描以查找特定字符。大多数其他不需要的特殊字符我已经能够使用一些正则表达式模式摆脱。但是有一个方框字符,类似于“□”。当我尝试从实际文本文件中复制字符并将其传递到此处时,我得到“�”,因此该框的示例来自 Windows 字符映射,其中包含代码“U+25A1”,我不确定如何解释或者如果它是我可以用于正则表达式搜索的东西。
有谁知道我如何在 UTF-8 编码文件中搜索类似于“□”的框符号?
编辑:
以下是文本文件中的示例:
“�当花苞出现时修剪棕榈树,或延迟修剪到棕榈树开花后,以防止棕榈花毛虫的侵扰。留下前五行。”
唯一的问题是,如原帖中所述,正方形被转换为菱形问号。
解决方案
推荐阅读
- android - 在 SQLite 上插入或替换不起作用
- sql - 子 ID 父 ID 概念
- c# - 创建并注册 C# COM Dll
- javascript - 为什么在使用 setTimeout 的后续调用中未定义 retry_interval
- powerapps - Powerapps:使用 Excel 数据源,屏幕空白
- java - 杰克逊自定义反序列化器委托回到默认值
- mediawiki - mediawiki 默认类别中的类别
- keras - 如何在 CNN 中训练卷积核?
- python - 问:ModuleNotFoundError:没有名为“matplotlib.pyplot”的模块等
- objective-c - 如何将带有非托管引用的 Swift 代码移植到 Objective-C