android - 录音机 | 解释频谱分析仪的 FFT 数据
问题描述
我正在构建一个需要能够显示实时频谱分析仪的应用程序。这是我能够在 iOS 上成功制作的版本:
我正在使用 Wendykierp JTransforms库来执行 FFT 计算,并设法捕获音频数据并执行 FFT 函数。见下文:
short sData[] = new short[BufferElements2Rec];
int result = audioRecord.read(sData, 0, BufferElements2Rec);
try
{
//Initiate FFT
DoubleFFT_1D fft = new DoubleFFT_1D(sData.length);
//Convert sample data from short[] to double[]
double[] fftSamples = new double[sData.length];
for (int i = 0; i < sData.length; i++) {
//IMPORTANT: We cannot simply cast the short value to double.
//As a double is only 2 bytes (values -32768 to 32768)
//We must divide by 32768 before we cast to Double.
fftSamples[i] = (double) sData[i] / 32768;
}
//Perform fft calcs
fft.realForward(fftSamples);
//TODO - Convert FFT data into 20 "bands"
} Catch (Exception e)
{
}
在 iOS 中,我使用了一个库 ( Tempi-FFT ),它具有计算幅度、频率和为任何给定数量的波段提供平均数据的功能(如上图所示,我使用了 20 个波段)。看来我对这个库没有那么奢侈,我需要自己计算一下。
寻找有关如何对 FFT 计算返回的数据进行交互的任何好的示例或教程。这是我收到的一些示例数据:
-11387.0, 183.0, -384.9121475854448, -224.66315714636642, -638.0173005872095, -236.2318653974911, -1137.1498541119106, -437.71599514435786, 1954.683405957685, -2142.742125980924 ...
寻找如何解释这些数据的简单解释。我看过的其他一些问题要么无法理解,要么没有提供有关如何确定给定数量的频段的信息:
解决方案
您的问题可以分为两部分:找到所有频率的幅度(解释输出)并将频率平均到频带中
求所有频率的幅度:
我不会深入介绍快速傅里叶变换/离散傅里叶变换的复杂性(如果您想获得基本的了解,请参阅此视频),但要知道每个输出都有实部和虚部。
该realForward
函数的文档描述了虚部和实部在输出数组中的位置(我假设您的样本大小是偶数):
a[2*k] = Re[k], 0 <= k < n / 2 a[2*k+1] = Im[k], 0 < k < n / 2 a[1] = Re[n/2]
a
相当于你的fftSamples
,这意味着我们可以将这个文档翻译成如下代码(我已经分别更改了Re
和Im
到realPart
和imaginaryPart
):
int n = fftSamples.length;
double[] realPart = new double[n / 2];
double[] imaginaryPart = new double[n / 2];
for(int k = 0; k < n / 2; k++) {
realPart[k] = fftSamples[k * 2];
imaginaryPart[k] = fftSamples[k * 2 + 1];
}
realPart[n / 2] = fftSamples[1];
现在我们有了每个频率的实部和虚部。我们可以将它们绘制在 xy 坐标平面上,使用实部作为 x 值,虚部作为 y 值。这创建了一个三角形,三角形斜边的长度就是频率的大小。我们可以使用勾股定理来得到这个量级:
double[] spectrum = new double[n / 2];
for(int k = 1; k < n / 2; k++) {
spectrum[k] = Math.sqrt(Math.pow(realPart[k], 2) + Math.pow(imaginaryPart[k], 2));
}
spectrum[0] = realPart[0];
请注意,频谱的第 0 个索引没有虚部。这是信号的直流分量(我们不会使用它)。
现在,我们有一个数组,其中包含整个频谱中每个频率的幅度(如果您的采样频率为 44100Hz,这意味着您现在有一个频率幅度在 0Hz 和 44100Hz 之间的数组,并且如果您的数组中有 441 个值,那么每个索引值代表一个 100Hz 的步长。)
将频率平均到频带中:
现在我们已经将 FFT 输出转换为我们可以使用的数据,我们可以继续您问题的第二部分:找到不同频带的平均值。这个比较简单。我们只需要将数组分成不同的波段并找到每个波段的平均值。这可以这样概括:
int NUM_BANDS = 20; //This can be any positive integer.
double[] bands = new double[NUM_BANDS];
int samplesPerBand = (n / 2) / NUM_BANDS;
for(int i = 0; i < NUM_BANDS; i++) {
//Add up each part
double total;
for(int j = samplesPerBand * i ; j < samplesPerBand * (i+1); j++) {
total += spectrum[j];
}
//Take average
bands[i] = total / samplesPerBand;
}
最终代码:
就是这样!您现在有一个数组,称为bands
每个频带的平均幅度。上面的代码故意没有优化以显示每个步骤的工作原理。这是一个缩短和优化的版本:
int numFrequencies = fftSamples.length / 2;
double[] spectrum = new double[numFrequencies];
for(int k = 1; k < numFrequencies; k++) {
spectrum[k] = Math.sqrt(Math.pow(fftSamples[k*2], 2) + Math.pow(fftSamples[k*2+1], 2));
}
spectrum[0] = fftSamples[0];
int NUM_BANDS = 20; //This can be any positive integer.
double[] bands = new double[NUM_BANDS];
int samplesPerBand = numFrequencies / NUM_BANDS;
for(int i = 0; i < NUM_BANDS; i++) {
//Add up each part
double total;
for(int j = samplesPerBand * i ; j < samplesPerBand * (i+1); j++) {
total += spectrum[j];
}
//Take average
bands[i] = total / samplesPerBand;
}
//Use bands in view!
这是一个很长的答案,我还没有测试代码(尽管我确实计划这样做)。如果您发现任何错误,请随时发表评论。
推荐阅读
- apache-spark - 如何在纱线客户端上从 jupyter 运行 spark
- javascript - 比较输入文本和人名只属于一个输入数字id
- angular - 无法初始化 FormGroup
- javascript - 如何将从 1 个量角器测试脚本中检索到的变量传递给另一个
- c++ - 返回析构函数有副作用的对象
- python - 如何将 dask 数据帧写入谷歌云存储或 Bigquery
- javascript - javascript字符串日期格式之间的区别
- python - 在 matplotlib 的水平条形图上添加百分比值
- javascript - 如何在套接字 io 连接中长时间保持活动客户端会话
- c# - C#DownloadStringTaskAsync:为什么没有触发超时异常捕获?