首页 > 解决方案 > 语音合成器和 SSML

问题描述

我一直在尝试使用韵律音高属性,但似乎并不简单或似乎有效。我想按照 g 大调创建一个简单的“do re mi”。使用不同的赫兹值,结果并不像预期的那样。有时它似乎做它想做的事,不管我放什么。例子:

        <prosody pitch="0Hz">A</prosody><break time="100ms" />
        <prosody pitch="+2st">E</prosody><break time="100ms" />
        <prosody pitch="+4st">I</prosody><break time="100ms" />
        <prosody pitch="+6st">O</prosody><break time="100ms" />
        <prosody pitch="+8st">U</prosody><break time="100ms" />

标签: c#azure-cognitive-servicesssmlazure-speechspeechsynthesizer

解决方案


看看所有的替代品,亚马逊、谷歌等,他们都说神经语音不完全支持音高。我怀疑 SpeechSynthesizer 也是如此,它解释了不一致的结果。Microsoft,请相应地更新您的文档。

以下 MS 文档并不完全正确:

神经语音现在支持重要的音高轮廓变化。


推荐阅读