tags - 需要在数据集中查找缺失/未配对的 XML 标记
问题描述
我有一个包含 5000 个这样的句子的数据集 -
<sad> Jessica was disappointed <cause> when her daughter had problems with her friends. <\cause> <\sad>
我需要检查每个句子是否有一个开始原因标签<cause>
和一个结束原因标签<\cause>
还可以通过两个标签突出显示文本并手动滚动以检查所有句子上是否存在突出显示。
有什么工具吗?通过 FIND 的正则表达式会起作用吗?
解决方案
推荐阅读
- php - 有什么更好的方法可以使这种插入物更安全、更安全,不会被注射和操纵
- reactjs - 无法在反应嵌套的 useState 挂钩中读取未定义的属性“状态”
- java - 使用 Spring Boot 作为通用 JAR 和 Gradle 的传递依赖项
- java - 如何从浏览器调用 servlet doPost() 方法
- ruby-on-rails - 如何在 AWS Fargate 上使用 webpack 配置 Rails 5
- javascript - 笑话覆盖没有检测到 node.js 中的某些文件
- gremlin - 如何从本地 gremlin-console 将 graphml 文件加载到 Janusgraph 的远程实例中
- python - 我将如何通过 Python 中的这个断言测试来尝试查找字典中列出的所有视图数量的总和?
- android - 在 Android 中放置坐标
- php - 如何在 Symfony 的 ChoiceType 表单中的 select 标签内添加“selected & disabled”选项标签?