html - spaCy 是否处理下标和上标?
问题描述
我有一些包含标签的 HTML<sub>
文本<sup>
。我想知道如何将它们转换为纯文本,以便当前的 spaCy 模型正确处理它们。
我应该将和转换为类似的东西a_b
并a^b
保留下标和上标吗?谢谢。
解决方案
推荐阅读
- php - Apache 在启动库未加载时给出错误原因:即使文件存在,也找不到图像
- c# - NavigationView.Loaded 方法没有被调用
- documentum - 即使没有添加到restricted_folder_ids 中,是否可以向用户显示其他文件柜?
- google-cloud-dataflow - 未使用运行时参数的数据流模板
- php - yii2 Kartik 文件输入仅在刷新页面后工作
- html - 引导轮播图像并不总是显示;清除缓存后仅恢复图像
- sql - TSQL - 返回开始日期和结束日期之间每个月的记录,即使该月没有可用数据
- asp.net - 将 ASP.NET Web API 与 Twilio 一起使用,而不是 ASP.NET MVC 控制器
- javascript - 如何仅使用 JS 使文本可点击
- python - Matplotlib / Seaborn 图例在添加标签时改变样式