首页 > 解决方案 > 教程 tensorflow 音频音高分析

问题描述

我是 tensorflow 和 Python 的初学者,我正在尝试构建一个应用程序,它可以自动检测足球(足球)比赛中的一些关键时刻(黄牌/红牌、进球等)。

我开始了解如何在我构建的数据集上进行视频分析训练程序,从网络下载图像并标记它们。为了获得更好的分析结果,我想知道是否有人对教程有一些建议,以便了解如何在音频文件上训练我的应用程序,以使程序能够理解何时存在音高变化在视频的音频中并结合视频和音频分析以获得更好的结果。

先感谢您

标签: python-3.xtensorflowaudioanalysispitch

解决方案


由于你是 Python 和 tensorflow 的新手,我建议你现在只关注音频,特别是因为它是足球比赛中重要事件的有力指标(红/黄牌、严重的犯规、进球、强大的机会、精彩的比赛) , ETC)。

非常简单,根本不用太多 ML,你可以使用一个时间段的平均量来推断显着性。如果您想更复杂一点,可以考虑使用语音到文本库来查找评论员语音中的关键字。

使用视频来确定重要的事情何时发生是非常非常具有挑战性的。

此页面可以帮助您开始使用 Python 进行音频信号处理。

https://bastibe.de/2012-11-02-real-time-signal-processing-in-python.html


推荐阅读