首页 > 解决方案 > Opensmile:从 wav 文件中提取韵律特征时无法读取的 csv 文件

问题描述

在使用 Windows 版本的 Opensmile 使用 Opensmile 时,我正在从音频文件中提取韵律特征。它运行成功并生成输出 csv。但是当我打开 csv 时,它会显示一些不可读的行。我用这个命令来提取韵律特征:

SMILEXtract  -C \opensmile-3.0-win-x64\config\prosody\prosodyShs.conf -I audio_sample_01.wav -O prosody_sample1.csv

csv 的输出如下所示:

[上述韵律特征的命令的输出1

即使我尝试使用在 opensmile 目录中给出的示例音频文件夹中给出的示例波形文件,输出也是相同的(不可读)。有人可以帮助我确定问题的实际出处吗?我该如何解决?

标签: csvaudiofeature-extractionaudeering-opensmile

解决方案


您需要在配置文件中启用 csvSink 组件才能使其工作。您正在使用的文件config\prosody\prosodyShs.conf没有定义此组件,并且始终写入二进制输出。

您可以通过这种方式验证它是否是标准二进制输出:-O从您的命令中省略参数,使其变为SMILEXtract -C \opensmile-3.0-win-x64\config\prosody\prosodyShs.conf -I audio_sample_01.wav并执行它。您将得到一个output.htkprosody_sample1.csv.

怎么输出csv?您可以查看定义组件的示例opensmile-3.0-win-x64\config\demo\demo1_energy.conf配置csvSink

您可以在官方文档中找到更多信息:


推荐阅读