首页 > 解决方案 > 我可以从 Dragon Medical Practice Edition 4 中捕获语音转录吗?

问题描述

我想用一个文本框构建一个应用程序,该文本框捕获由 Dragon Medical Practice Edition 4 (DMPE4) 在 Windows 环境中创建的语音转录。默认情况下,DMPE4 会将转录的文本放置到光标的当前位置。这意味着如果用户在他们想要听写的位置以外的地方单击其他地方,那么语音将被转录到不同的窗口中(或者更糟糕的是,如果没有可用的文本框,他们所听写的内容将不会出现在任何地方)。

我想要一个带有文本框的 WPF 应用程序,无论当前光标位置在哪里,它都会捕获文本,它应该将转录的文本放入光标最后所在的文本框中。只要应用程序打开并且带有文本框的窗口处于活动状态,就不可能在其他任何地方转录文本。我仍然想使用 DMPE4 应用程序和它的所有其他功能,我只是希望转录的文本进入特定的文本框。

我找到的几个教程是基于System.Speech微软内置的语音识别,我想使用 DMPE4,但似乎找不到一个好的起点。

DMPE4 有类似的东西叫做听写框,但是为了从听写框中获取文本到需要文本的位置,还有其他步骤,我希望文本直接进入新应用程序的文本框。

标签: c#wpfnaturallyspeaking

解决方案


由于 DMPE 是一个封闭的应用程序,并且很可能模拟击键,因此您需要以某种方式包装它,捕获它的输出并使用它。我这样做的第一个想法是在虚拟机中运行它(或者像 docker 这样的容器就足够了),它只会将字符写入您的侦听器应用程序,然后您可以在其他地方传输和使用它。

但是,如果您只需要创建基于 Dragon Medical 的语音识别的解决方案,我会从他们的 SDK 开始,它可以为任何软件提供语音识别功能:https ://www.nuance.com/dragon/for-developers /dragon-software-developer-kit.html


推荐阅读