rest - 语音分析 自动语音识别、多说话人分离、情绪、说话人重叠
问题描述
是否有任何公司为此服务提供API ?
语音、音频分析、自动语音识别、多说话者分离、情绪、说话者重叠(检测同时说话的说话者)。
我的项目需要检测音频上的扬声器并将它们分开,还需要检测扬声器之间是否有任何碰撞(重叠)(一起说话)。
现在我使用DeepAffect,但他们的支持很差,所以我寻找另一家处理该问题的公司
注意:我在下面写的服务我已经检查过了,它对我的目标没有用。
-symbl.ai
-Cloud Speech-to-Text - 语音识别| 谷歌云
-azure 认知服务
- 人工智能支持的 Amazon Connect 语音分析
解决方案
它不太清楚您期望/拥有哪种类型的设置。
云服务?本地?什么尺码?
您可以查看以下提供此类解决方案的Phonexia公司。https://www.phonexia.com/en/ 这里列出了他们的解决方案可能提供的 API 和功能:https ://download.phonexia.com/docs/spe/
推荐阅读
- java - FileNotFoundException Android 文件未找到
- javascript - 在代码后面使用用 axios 收集的数据
- r - 用 LaTeX 在 Rmarkdown 中编写方程的“系统”
- spring-boot - 我应该如何为实体设计状态字段
- npm-install - 编译失败错误
- c# - 每 X 秒读取一次串口
- python - 代码中的错误(只有整数标量数组可以转换为标量索引)
- reactjs - 当 HTML 元素存在时 toContainHTML 提供错误(反应测试)
- python - 实例之间的 PyQt Signal Slots 连接
- node.js - express js:端口正在运行但无法终止端口