c# - 语音合成器和 SSML
问题描述
我一直在尝试使用韵律音高属性,但似乎并不简单或似乎有效。我想按照 g 大调创建一个简单的“do re mi”。使用不同的赫兹值,结果并不像预期的那样。有时它似乎做它想做的事,不管我放什么。例子:
<prosody pitch="0Hz">A</prosody><break time="100ms" />
<prosody pitch="+2st">E</prosody><break time="100ms" />
<prosody pitch="+4st">I</prosody><break time="100ms" />
<prosody pitch="+6st">O</prosody><break time="100ms" />
<prosody pitch="+8st">U</prosody><break time="100ms" />
解决方案
看看所有的替代品,亚马逊、谷歌等,他们都说神经语音不完全支持音高。我怀疑 SpeechSynthesizer 也是如此,它解释了不一致的结果。Microsoft,请相应地更新您的文档。
以下 MS 文档并不完全正确:
神经语音现在支持重要的音高轮廓变化。
推荐阅读
- bash - 如何使用 bash 脚本为最后一个单词腾出空间
- common-lisp - Common Lisp SXHASH 和嵌套列表
- java - 具有作为构造函数参数传递的泛型基类的枚举
- python - 不能在里面使用几何管理器包。已经有网格管理的从属,尽管主窗口不同
- maven - Gradle 7 中删除了旧版 `maven` 插件。请改用 `maven-publish` 插件
- ios - 为什么 iOS 拒绝 LetsEncrypt 驱动的证书?
- android - 如何为具有特定子子值的子项检索 Firebase DatabaseReference?
- python - 使用 python,我如何为 macOS 声音播放器 NSSound 构造一个委托?
- javascript - 函数内的基本函数
- javascript - 为什么animejs在svelte-kit骨架项目的构建中抛出这个错误?