首页 > 解决方案 > HTK:了解生成的 .mlf 文件中的分数

问题描述

我试图了解文件结果recout.mlf,所以我在该文件中有以下几行:

在此处输入图像描述

哪个'as'发音很好:带有-524.427185或-1054.774536的那个

标签: machine-learningspeech-recognitionmfcchtk

解决方案


在解码过程中获得的声学分数通常非常小。为了防止下溢,使用对数似然代替似然:1.5 Recognition and Viterbi Decoding

较小的参数值对应于较大的对数负值:

自然原木

因此,第一个“as”获得了更高的 (-524.427185) 声学分数。对数是单调函数(参数越大 - 值越大),因此您可以直接比较对数似然:-524 > -1054.

顺便说一句,这并不一定意味着第一个“as”发音更好。声学分数取决于许多因素,包括模型拓扑和模型训练的数据。


推荐阅读