python - 使用 K 均值进行语音识别
问题描述
我指的是以下代码: https ://github.com/Z3376/Speech-Recognition-with-Transfer-Learning/blob/master/audio_task2.ipynb
我已经建立了用于特征提取的 CNN 模型,并希望使用 K 均值进行聚类。我使用了一个 .wav 文件(呼叫中心代理和客户之间的对话)来测试我的模型并希望对其执行说话人识别。
kmeans = KMeans(3,init='k-means++')
y_kmeans = kmeans.fit_predict(features)
unique,counts = np.unique(y_kmeans,return_counts=True)
print(unique)
print(counts)
它给了我输出:
[0 1 2]
[33 32 74]
[33 32 74] 是什么意思?
我如何了解扬声器?
还请告诉检查准确性的最佳方法
解决方案
推荐阅读
- javascript - 是否可以简化从二维数组中的一个数组中搜索重叠元素以避免嵌套 for 循环?
- c++ - 尽管使用#ifndef,但函数的C++错误重新定义
- javascript - 解决导航栏中 li 元素消失的问题(HTML、CSS、JS)
- python - 在另一个字符串中查找一个字符串的所有排列
- java - 删除 Weka ML 模型的测试 ARFF 文件中的最后一个类属性在预测模型中不起作用
- java - 如何使用 file_name_sysdate 创建 tfileoutputdelimited 作为特定会话运行的文件名并附加数据
- java - 如何在控制台(java)中移动字符的位置
- rust - PathBuf::deref() 如何返回对临时对象的引用?
- firebase - 安装 react-navigation 模块会破坏 firebase 模块
- node.js - 车把助手未使用 gulp 评估,带有 express-handlebars 的 webpack