首页 > 解决方案 > 正则表达式使用记事本++从一个巨大的文档中删除相同的部分

问题描述

我有 300 万行这种格式的文本

> Dyskeratosis congenita
>        DYSKERATOSIS CONGENITA AUTOSOMAL DOMINANT 1" title="DYSKERATOSIS CONGENITA AUTOSOMAL DOMINANT 1">  DYSKERATOSIS CONGENITA AUTOSOMAL  DOMINANT 1>
>        DYSKERATOSIS CONGENITA AUTOSOMAL DOMINANT 2" title="DYSKERATOSIS CONGENITA AUTOSOMAL DOMINANT 2">  DYSKERATOSIS CONGENITA AUTOSOMAL  DOMINANT 2>
>        DYSKERATOSIS CONGENITA AUTOSOMAL DOMINANT 3" title="DYSKERATOSIS CONGENITA AUTOSOMAL DOMINANT 3">  DYSKERATOSIS CONGENITA AUTOSOMAL  DOMINANT 3>
>        DYSKERATOSIS CONGENITA AUTOSOMAL DOMINANT 4" title="DYSKERATOSIS CONGENITA AUTOSOMAL DOMINANT 4">  DYSKERATOSIS CONGENITA AUTOSOMAL DOMINANT 4>
>        DYSKERATOSIS CONGENITA AUTOSOMAL DOMINANT 6" title="DYSKERATOSIS CONGENITA AUTOSOMAL DOMINANT 6">  DYSKERATOSIS CONGENITA AUTOSOMAL  DOMINANT 6>

我想删除以“title=to>”开头的每个部分,我无法修复正则表达式以在记事本 ++ 中使用

标签: regexnotepad++

解决方案


您可以使用以下 RegEx 来查找匹配项:

".+>

我不知道记事本++,但你现在要做的就是用空字符串替换。

编辑:如果你想匹配第一个'>',那么使用这个:

"".+\">

推荐阅读