首页 > 解决方案 > spaCy 是否处理下标和上标?

问题描述

我有一些包含标签的 HTML<sub>文本<sup>。我想知道如何将它们转换为纯文本,以便当前的 spaCy 模型正确处理它们。

我应该将和转换为类似的东西a_ba^b保留下标和上标吗?谢谢。

标签: htmltagsspacysubscriptsuperscript

解决方案


推荐阅读