首页 > 解决方案 > 语音分析 自动语音识别、多说话人分离、情绪、说话人重叠

问题描述

是否有任何公司为此服务提供API ?

语音、音频分析、自动语音识别、多说话者分离、情绪、说话者重叠(检测同时说话的说话者)。

我的项目需要检测音频上的扬声器并将它们分开,还需要检测扬声器之间是否有任何碰撞(重叠)(一起说话)。

现在我使用DeepAffect,但他们的支持很差,所以我寻找另一家处理该问题的公司

注意:我在下面写的服务我已经检查过了,它对我的​​目标没有用。

-symbl.ai

-Cloud Speech-to-Text - 语音识别| 谷歌云

-azure 认知服务

- 人工智能支持的 Amazon Connect 语音分析

标签: restspeech-recognitionspeech-to-textvoice-recognitionvoice

解决方案


它不太清楚您期望/拥有哪种类型的设置。

云服务?本地?什么尺码?

您可以查看以下提供此类解决方案的Phonexia公司。https://www.phonexia.com/en/ 这里列出了他们的解决方案可能提供的 API 和功能:https ://download.phonexia.com/docs/spe/


推荐阅读