speech-recognition - 有没有办法使用 Alexa 或 DialogFlow.ai 等技术来使用原始音频数据?
问题描述
我正在开发一个使用语音识别来帮助盲人学习音乐的应用程序。为此,我正在考虑使用DialogFlow.ai甚至Amazon Alexa之类的东西,以免重蹈覆辙。因此,有时我想使用原始音频数据来检查乐器是否经过调音。使用这些技术,默认情况下,所有音频输入都会被解释并因此转换为文本。那么,有没有办法使用原始音频数据而不是解释用户语音呢?
解决方案
出于多种原因(主要是安全性),Amazon Alexa 和其他类似技术不允许您获取用户的原始输入。使用 Amazon Alexa 作为一种捕获乐器音频输入的方法并不是实现调谐器的合理方法。您应该实现自己的方式来捕获音频,并可能将其与 Alexa/DialogFlow 结合使用以进行命令解释。
推荐阅读
- c - 日间 TCP 客户端中的连接错误
- javascript - 向上提升状态:从子组件向上通信
- c++ - RGB 元素数组交换
- node.js - '。' 不被识别为内部或外部命令(运行 npm install for firebaseUI 时)
- javascript - 如何在也是控件模板的 js 小部件中向 Kendo 模板提供数据
- c++ - 在构造函数中浅拷贝字符串数组
- jenkins-pipeline - SonarQube 与 Jenkins 集成时出现 403 错误
- php - Lumen 5.6.4 获取路由后抛出 MethodNotAllowedHttpException
- c# - 程序集依赖已定义错误
- java - 如何更新 Recyclerview 中的数据?