javascript - TensorFlow 语音命令识别分数
问题描述
我有一个recognizer
并使用它的listen
函数从中获取Float32Array
数组SpeechCommandRecognizerResult.spectrogram.data
,然后使用concatenateFloat32Arrays
util 函数连接数组
分数 ( SpeechCommandRecognizerResult.scores
) 是normalized
在使用listen
函数时,但是当我使用recognize
函数并提供 a Float32Array
as aninput
时,分数是not normalized
如何使用of获得normalized
scores
usingrecognize
功能?input
Float32Array
解决方案
仅仅因为你放入一个标准化数组并不意味着它会以这种方式出现。看起来识别器输出输入音频的单词概率listen
。从这里的代码
export interface SpeechCommandRecognizerResult {
/**
* Probability scores for the words.
*/
scores: Float32Array|Float32Array[];
虽然概率通常是归一化的,但这个神经网络的输出概率可能仅用于相互比较以确定它是哪个单词。找到输出数组的最大索引以获取它所预测的单词。
推荐阅读
- basic-authentication - OpenApi Basic Auth 注解
- mysql - 在 MySQL 中使用子查询时检查插入表的重复条目
- python - 使用 VS Code 运行 Python - 基础知识
- linux - 如何在 ls 输出中按照从左到右的顺序更改文件名?
- python - python-telegram-bot 错误内联:未指定输入消息内容
- mysql - mysql查询以获取用户尚未完成的preq任务
- r - 是否有用于将列表中的向量修剪为最小向量长度的 R 函数?
- create-react-app - npm 启动错误:EPERM:不允许操作,mkdir 'C:\Windows\System32\robinhood\node_modules\.cache'
- c# - C# .net 串口接收缓冲区始终为空
- macos - Turn off Dark Mode only for Safari in macOS Big Sur 11.6