首页 > 解决方案 > 如何使语音文本理解字符和数字,而不是单词

问题描述

当使用谷歌语音到文本 API 并说出一串字符而不是单词时,谷歌会尝试派生单词,所以如果我说:okyjtbrx,它会将其转录为 Okay Why Jay brtx。有没有办法强迫它理解字符而不是单词?

标签: google-cloud-platformdialogflow-esgoogle-cloud-speech

解决方案


你不能直接强迫它把它理解为一串字符;但是,您可以遵循以下两个建议,这可能有助于获得所需的结果:

语音转文本 API

如果你直接使用 Speech API,你可以在你的requests中使用语音适配。此功能允许您为识别请求提供额外的上下文,提供有助于识别的短语或类。

对于您的特定用例,您应该查看可用于某些语言$OOV_CLASS_ALPHANUMERIC_SEQUENCE类标记之一。

此选项将告诉模型您期望在请求中出现一系列字母 [az] 和数字。

对话流

我添加此选项是因为您在问题的标签中包含了 Dialogflow。如果识别是使用 Dialogflow 完成的,那么您可以使用正则表达式实体尝试将用户意图与正则表达式定义的模式相匹配。


推荐阅读