google-cloud-platform - 如何使语音文本理解字符和数字,而不是单词
问题描述
当使用谷歌语音到文本 API 并说出一串字符而不是单词时,谷歌会尝试派生单词,所以如果我说:okyjtbrx,它会将其转录为 Okay Why Jay brtx。有没有办法强迫它理解字符而不是单词?
解决方案
你不能直接强迫它把它理解为一串字符;但是,您可以遵循以下两个建议,这可能有助于获得所需的结果:
语音转文本 API
如果你直接使用 Speech API,你可以在你的requests中使用语音适配。此功能允许您为识别请求提供额外的上下文,提供有助于识别的短语或类。
对于您的特定用例,您应该查看可用于某些语言$OOV_CLASS_ALPHANUMERIC_SEQUENCE
的类标记之一。
此选项将告诉模型您期望在请求中出现一系列字母 [az] 和数字。
对话流
我添加此选项是因为您在问题的标签中包含了 Dialogflow。如果识别是使用 Dialogflow 完成的,那么您可以使用正则表达式实体尝试将用户意图与正则表达式定义的模式相匹配。
推荐阅读
- javascript - 使用javascript,重定向到其他站点后如何自动对焦?
- java - ND4J 执行时间
- mysql - SQL查询获取最近5天或10天的最大值记录
- maven - Intellij 工件工具无法创建正确的可执行火花 jar
- python - 如何将覆盖结果与毒性结合起来?
- javascript - 如何从 HTML 调用 php 函数
- javascript - 会话之间是否可以在浏览器中存储超过 100 MB 的空间?
- node.js - 使用邮件监听器下载附件
- azure - Azure ARM - 将作为参数传递的标签与文字标签结合起来
- java - String java中分割字符链的重复