首页 > 解决方案 > 优化移植到 Python 的 C 算法

问题描述

我想用 Python 写一个 Real-time Audio to Pitch 算法,看起来 Yin 算法解决了这个问题。我找到了许多 Yin 的 C 实现,并且在我的声音中尝试了其中一个,它可以按预期实时工作。我已经开始将它移植到 Python,但我可以看到它慢了大约 100 倍 - 所以不再是实时的。我使用的是 2.3 GHz 四核 Intel Core i7。

下面是用 C 和 Python 对算法进行的模拟,以了解所涉及的计算。每个模拟计算 90,000 个样本的音高。C 函数需要 2 秒,Python 需要 200 秒才能完成。

C代码

#include <stdio.h>
#include <stdint.h>
#include <time.h>

int main(int argc, char** argv) {
    int buffer_length = 150;
    float sec = 0;
    float* buffer = malloc(sizeof(float)*buffer_length);
    
    clock_t before = clock();

    int j;
    int16_t tau;
    int16_t i;
    float delta;
    
    for(j = 0; j < 90000; j++){
        for(tau = 0 ; tau < 75; tau++){
            for(i = 0; i < 75; i++){
                delta = buffer[i] - buffer[i + tau];
                buffer[tau] += delta * delta;
            }
        }    
    }
    
    clock_t difference = clock() - before;
    sec = difference / (float )CLOCKS_PER_SEC;
    printf("%f\n",sec);
    
    return 0;
}

Python代码

import time

buffer = [0.0]*150

ts = time.time()

for j in range(90000):
    for tau in range(75):
        for i in range(75):
            delta = buffer[i] - buffer[i + tau]
            buffer[tau] += delta * delta

print(time.time()-ts)

我正在考虑使用 8KHz 的采样率,但如果可能的话,可能会使用更高的采样率。是否有可能大大提高 Python 代码的性能,如果可以,我将如何去做?如果没有,那么我想用 Python Wrapper 编写一个 C 库是我唯一的选择。

标签: pythoncoptimizationsignal-processing

解决方案


这看起来像是numba的工作。问题是 python for 循环C 循环慢得多。使用 numba 您应该能够显着加快它们的速度,因为您自己编写了它们并且没有外部依赖项(已知会与 numba 混淆)。

只需使用 njit 装饰器并将嵌套的 for 循环包装在一个函数中。


推荐阅读