首页 > 解决方案 > 如何将编码为字节字符串的音频文件解码为 numpy 数组?

问题描述

目前,我有一个 React.js 前端与 Flask 后端配对的项目。我正在使用前端从麦克风收集短音轨并将该数据提供给我的后端进行处理。现在,前端在 POST 请求中将麦克风数据作为 base64 字符串发送,而我的后端需要在将数据作为带有 librosa 的 python ndarray 加载回之前,将数据解码并保存到“temp.wav”的磁盘中。出于隐私和效率的原因,我不想在将文件加载回内存之前将其保存在本地,但我似乎无法弄清楚如何将数据从 byte64 表示形式转换为 numpy.ndarray librosa 输出。

这是前端代码的片段:

let blob = new Blob(audio.audioChunks, {type: 'audio/wav'});
const reader = new FileReader();
reader.readAsDataURL(blob);
reader.onload = () => {
  let base64data = reader.result.split(',')[1];
  fetch('/api/task', {
    method: 'POST',
    headers: { 'Content-Type': 'application/json' },
    body: JSON.stringify({ message: base64data })
  }).then(res => res.json()).then(data =>{
    console.log(data)
  });
};

和我的 Flask 后端代码:

@app.route('/api/task', methods=['POST'])
def hello_world(): #just a filler name
    content = request.get_json()
    ans = base64.b64decode(bytes(content["message"], 'utf-8'))

    with open("temp.wav", "wb") as fh:
        fh.write(ans)

    audio_input, _ = librosa.load("temp.wav", sr=16000)
    #do something with audio_input

我真的需要后端是 Flask,因为我需要访问其他语言中不可用的不同 Python 工具。

标签: javascriptpythonwavnumpy-ndarraylibrosa

解决方案


您将使用librosa.stream而不是librosa.load.

https://librosa.org/doc/main/generated/librosa.stream.html


推荐阅读