首页 > 解决方案 > TensorFlow 语音命令识别分数

问题描述

我有一个recognizer并使用它的listen函数从中获取Float32Array数组SpeechCommandRecognizerResult.spectrogram.data,然后使用concatenateFloat32Arraysutil 函数连接数组

分数 ( SpeechCommandRecognizerResult.scores) 是normalized在使用listen函数时,但是当我使用recognize函数并提供 a Float32Arrayas aninput时,分数是not normalized

如何使用of获得normalized scoresusingrecognize功能?inputFloat32Array

标签: javascripttensorflowmachine-learningspeech-recognitiontensorflow.js

解决方案


仅仅因为你放入一个标准化数组并不意味着它会以这种方式出现。看起来识别器输出输入音频的单词概率listen。从这里的代码

export interface SpeechCommandRecognizerResult {
  /**
   * Probability scores for the words.
   */
  scores: Float32Array|Float32Array[];

虽然概率通常是归一化的,但这个神经网络的输出概率可能仅用于相互比较以确定它是哪个单词。找到输出数组的最大索引以获取它所预测的单词。


推荐阅读