regex - 原始文本中子字符串的索引
问题描述
我正在使用Python处理自然语言处理问题之一。
我的问题:让我们考虑一个字符串
str1 = "United, State is a very nice country"
我们预处理这个字符串,我们删除了所有特殊符号、URL、HTML 内容等。现在预处理的字符串将变成这样:
preprocessed_str = "United State is a very nice country"
然后我们将这个预处理的字符串传递给我的机器学习模型,该模型返回如下结果:
Country: United State
现在我想在原始字符串中获取“美国”的开始和结束索引。
我们用python 的 str.find()函数尝试了这个,但它返回 -1。
我将欣赏我们可以解决此问题的方法和解决方案。提前致谢 :)
解决方案
推荐阅读
- syntax - 使用变量在 Python 中创建字典
- angular - 在角度问题中创建自动幻灯片
- python - 在附加列中合并两个 df 结果为 NaN
- bash - 如何从命令提示符打印/回显“警报”(07)
- reactjs - 如何将所选项目的值传递给输入字段的值
- r - R:使用 qplot 绘制数据
- css - 如何在 CSS 中创建包含 8 个图像的 2 行网格
- python - 如何使一行中的最后一项成为字典的键,并将前面的项目保存为列表
- python - 创建删除用户单元测试 Django rest_framework
- c# - 有什么理由不总是使用 DecompressionMethods.All 吗?