python - 语音识别使用python检测特定单词
问题描述
我正在开发一个语音助手项目并使用 SpeechRecognition 库来识别用户的命令。我决定命名我的助手 ODI,并意识到 SpeechRecognition 库无法识别它。“ODI”关键字被识别为“body”或“audi”。我想知道是否有办法做到这一点?
我希望它持续倾听用户的声音,一旦使用“ODI”这个词,识别器就会开始识别其他命令。
编辑:我安装了 pocketsphinx 来检测语音中的关键字,然后在匹配关键字后将其传输到谷歌识别器。我尝试了两种方法,使用r.recognizer_sphinx(keyphrase=[('ode', 1)])
并LiveSpeech(keyword='ode')
包含阈值1e+20
和1e-40
. 这两种方法似乎都不起作用,一旦我提供了关键字参数,它就会用关键字解释所有内容。
这是代码片段:
def get_user_input(self):
with self.microphone as source:
self.recognizer.adjust_for_ambient_noise(source, duration=1)
print("listening")
audio = self.recognizer.listen(source)
try:
transcript = self.recognizer.recognize_sphinx(audio, language='en-us', keyword_entries=[('ode', 1)]).lower()
print("User said: {0}".format(transcript))
time.sleep(1)
except sr.UnknownValueError:
transcript = ''
print('Unable to recognize speech')
except sr.RequestError:
transcript = ''
print("Request failed")
except Exception as e:
print("Repeat Command", e)
return "None"
if "ode" in transcript:
new_transcript = self.recognizer.recognize_google(audio, language='en-ie').lower()
return new_transcript
使用“ode”而不是“odi”的原因是 CMU 词典有“ode”,这听起来很重要,但问题是它也不断将其他单词检测为“ode”。任何帮助将不胜感激,谢谢!
解决方案
推荐阅读
- javascript - 将标头传递给 bing 地图 API
- escaping - 期望:如何获取要发送的报价
- python - 在 Spotfire 中引用 FilterScheme 的名称
- amazon-web-services - 如何在 SAM template.yml 中包含多个资源文件
- excel - VBA在单元格中插入公式错误1004
- graphql - 内部服务器错误 - 发生内部服务器错误 // SANITY // GATSBY
- visual-studio-code - 使用终端命令保存工作区并在打开时执行
- nosql - 我尝试在 Microsoft Commos DB 中执行以下 NoSQL 语句,但没有成功
- r - R - 检查每列中的每个值是否小于该列的中位数
- python - 计算图像中白色的总像素数