首页 > 解决方案 > 需要在数据集中查找缺失/未配对的 XML 标记

问题描述

我有一个包含 5000 个这样的句子的数据集 -

<sad> Jessica was disappointed <cause>  when her daughter had problems with her friends. <\cause> <\sad>

我需要检查每个句子是否有一个开始原因标签<cause>和一个结束原因标签<\cause>

还可以通过两个标签突出显示文本并手动滚动以检查所有句子上是否存在突出显示。

有什么工具吗?通过 FIND 的正则表达式会起作用吗?

标签: tagsdataset

解决方案


推荐阅读