python-3.x - 教程 tensorflow 音频音高分析
问题描述
我是 tensorflow 和 Python 的初学者,我正在尝试构建一个应用程序,它可以自动检测足球(足球)比赛中的一些关键时刻(黄牌/红牌、进球等)。
我开始了解如何在我构建的数据集上进行视频分析训练程序,从网络下载图像并标记它们。为了获得更好的分析结果,我想知道是否有人对教程有一些建议,以便了解如何在音频文件上训练我的应用程序,以使程序能够理解何时存在音高变化在视频的音频中并结合视频和音频分析以获得更好的结果。
先感谢您
解决方案
由于你是 Python 和 tensorflow 的新手,我建议你现在只关注音频,特别是因为它是足球比赛中重要事件的有力指标(红/黄牌、严重的犯规、进球、强大的机会、精彩的比赛) , ETC)。
非常简单,根本不用太多 ML,你可以使用一个时间段的平均量来推断显着性。如果您想更复杂一点,可以考虑使用语音到文本库来查找评论员语音中的关键字。
使用视频来确定重要的事情何时发生是非常非常具有挑战性的。
此页面可以帮助您开始使用 Python 进行音频信号处理。
https://bastibe.de/2012-11-02-real-time-signal-processing-in-python.html
推荐阅读
- batch-file - 运行远程 exe 时使用 GMSA 的计划任务失败
- ms-access - 如何在 Access 表单上精确放置和对齐控件(Align 不这样做)?
- r - 将绘图从 Shiny 模块中的 renderUI 内部传递到主服务器
- amazon-web-services - 使用 CDK 将 GPU 分配给 ECS 中的容器
- docker - 在 docker.io 中授权 helm chart
- python-3.x - 为什么 'pyenv install --list' 没有列出我在 https://repo.anaconda.com/miniconda/ 上看到的所有 miniconda 发行版?
- javascript - 用 JS 中的变量控制 SVG 矩形的高度和宽度
- python - 类型错误:打开 excel 文件时的预期类 openpyxl.styles.fills.fill
- javascript - 通过 SIP javascript 在通话中静音/取消静音麦克风
- performance - discord.py:关于如何加快此命令处理时间的想法