首页 > 解决方案 > Webkit 语音识别 API:单音节

问题描述

我正在尝试使用 Webkit Speech Recognition API 来识别单个音节,而不是完整的单词或句子。由于这个API需要“语法”定义,不知道有没有办法实现单音节识别。像“啊”或“bi”之类的东西。

谢谢

标签: javascriptspeech-recognitionwebkitspeechrecognition

解决方案


不幸的是,这对于 Web Speech API 是不可能的。尽管您可以创建自定义语法(它们是单词的集合),但您不能定义自定义词典或词汇表(它们是单词本身)。在您的情况下,您需要定义一个自定义词汇表,其中包含单个音素作为单词,然后将您的语法限制为仅从您的自定义词汇表中选择单词。有一些付费的基于云的服务可以让你做到这一点。

例如,使用 IBM Watson,您可以创建自定义语言模型,然后向模型中添加单词(在您的情况下,每个音素都是一个“单词”)。通常,自定义语言模型与通用语言模型混合,但您不希望这样,因此您将自定义权重设置为 1.0(这意味着它只会使用您的自定义语言模型)。

您也可以通过其他方式来解决它,但我怀疑您会找到一个不涉及付费服务的纯基于 Web 的解决方案。如果您能够迁移到本机平台(或在服务器上创建自己的基于 Web 的服务),那么您还有更多选择。例如,CMUSphinx 将允许您创建自定义字典以与服务器上的 Sphinx4 或移动设备上的 PocketSphinx 一起使用。尽管 CMUSphinx 不是用于大型词汇表应用程序的最准确系统,但您的自定义词汇表会很小,因此 CMUSphinx 会表现得非常好。


推荐阅读