首页 > 解决方案 > 客户端-服务器应用程序中的语音识别

问题描述

我必须在客户端-服务器应用程序中实现语音识别,软件需要是免费的并且可以在每个浏览器上运行(IE 除外)。这个想法是创建一个带有麦克风的图标,当用户单击它时,语音识别系统将激活并记录麦克风输入,当用户说出“打开 X”、“主页”、“退出”等命令时,系统将重定向到不同的子站点,返回主页或从应用程序中注销用户。做这个的最好方式是什么?它是客户端还是服务器端?用什么软件?如果是多个,如何整合?

我有一个想法向服务器发送请求(通过单击图标)并开始在服务器端录制并将识别的文本发送到客户端并根据输出执行某些操作,但我认为这是不可能的,或在客户端使用 MediaDevices 记录音频输入并将其发送到 pocket-sphinx.js(仍在客户端)并从中获取文本并执行某些操作。我基本卡住了。。

标签: client-serverspeech-recognitioncmusphinxmediadevices

解决方案


推荐阅读