ios - 如何在音频线程之外使用通过使用 AVAudioEngine 获得的 PCM 缓冲区的数据?
问题描述
我在 iOS 中使用 AVAudioEngine 从麦克风获取音频,并使用输入节点及其函数 installTap 将其写入缓冲区。
在 installTap 函数的 tapBlock 内部,它应该是读取和/或操作 PCM 缓冲区的地方,我需要调用一个 C 库函数,这个函数处理 PCM 缓冲区数据,它计算一个音频指纹,这个函数还需要读取一个文件,该文件是预先计算的音频指纹的数据库,以查找可能的匹配项。
问题是显然(如果我错了,请纠正我),你不能在这个块内进行任何文件 I/O 调用,因为这段代码正在另一个线程中运行,并且我传递给 C 端的文件指针始终为空或垃圾,这不会在此函数之外发生,(在主线程方面)指针有效,C 可以读取数据库文件。
如何在主线程中操作 PCM 缓冲区,以便进行文件 I/O 调用并能够计算 C 端所需的匹配?
我究竟做错了什么?
还有其他选择吗?谢谢。
import Foundation
import AVFoundation
let audioEngine = AVAudioEngine()
class AudioEngineTest: NSObject {
func setupAudioEngine() {
let input = audioEngine.inputNode
let inputFormat = input.outputFormat(forBus: 0)
let inputNode = audioEngine.inputNode;
//Convert received buffer to required format
let recordingFormat = AVAudioFormat(commonFormat: .pcmFormatInt16, sampleRate: Double(44100), channels: 2, interleaved: false)
let formatConverter = AVAudioConverter(from:inputFormat, to: recordingFormat!)
let pcmBuffer = AVAudioPCMBuffer(pcmFormat: recordingFormat!, frameCapacity: AVAudioFrameCount(recordingFormat!.sampleRate * 4.0))
var error: NSError? = nil
inputNode.installTap(onBus: 0, bufferSize: AVAudioFrameCount(2048), format: inputFormat)
{
(buffer, time) in
let inputBlock: AVAudioConverterInputBlock = { inNumPackets, outStatus in
outStatus.pointee = AVAudioConverterInputStatus.haveData
return buffer
}
formatConverter?.convert(to: pcmBuffer!, error: &error, withInputFrom: inputBlock)
if error != nil {
print(error!.localizedDescription)
}
//Calling the function from the C library, passing it the buffer and the pointer to the db file: dbFilePathForC an UnsafeMutablePointer<Int8>
creatingFingerprintAndLookingForMatch(pcmbuffer, dbFilePathForC)
//In this scope, the pointer dbFilePathFoC is either null or garbage, so the C side of things cannot read the database file, outside of this scope, the same pointer works and C can read the file, but I cannot read the PCM buffer because it only exists inside this scope of this closure of installTap, called the tapBlock
}
try! audioEngine.start()
}
}
获取指向数据库文件的指针的代码块
let documentsPath = NSSearchPathForDirectoriesInDomains(.documentDirectory, .userDomainMask, true)[0]
let dbPath = documentsPath+"/mydb.db"
do {
let text = try String(contentsOfFile: dbPath)
//converting dbPath to a pointer to be use in C
let cstringForDB = (dbPath as NSString).utf8String
let dbFilePathForC = UnsafeMutablePointer<Int8>(mutating: cstringForDB!);
} catch {
print("error cannot read the db file")
}
解决方案
任何线程都允许进行 I/O 调用。问题在于您的 C 字符串转换为UnsafeMutablePointer<Int8>
(它被称为不安全是有充分理由的)。您正在堆栈上执行此操作,让“变量”在您的 PCM 音频非主线程完成后消失。因此,您最终会得到一个指向某个随机内存的悬空指针。我怀疑您似乎在主线程上没有遇到同样的问题,因为它在整个应用程序生命周期中始终存在,并且在其堆栈上击中悬空指针的可能性较小(但仍然绝对有可能)。解决方案是让您的(UnsafeMutablePointer<Int8>
由yossan 提供)如下:
func makeCString(from str: String) -> UnsafeMutablePointer<Int8> {
let count = str.utf8CString.count
let result: UnsafeMutableBufferPointer<Int8> = UnsafeMutableBufferPointer<Int8>.allocate(capacity: count)
_ = result.initialize(from: str.utf8CString)
return result.baseAddress!
}
通过这样做,您可以在堆上为 C 字符串分配空间,该 C 字符串以安全的方式在所有线程之间共享(只要它是只读内存)。
推荐阅读
- typescript - Jscript.net 没有大部分 TypeScript 功能吗?
- php - 使用不同的 HTTP 方法重定向
- c# - Windows 窗体应用程序中的 Autofac 容器
- windows - 如何将所有 PowerShell 屏幕输出写入 .csv 报告文件
- react-native - 如何使用 react-native-maps 向多边形添加标题
- django - Django ORM:从单个模型反向关系查询多个模型
- node.js - 记录会话用户 NodeJs NestJs
- php - 尝试使用 updateOrCreate 方法更新记录时出现“尾随数据”错误
- docker - Docker:如何在容器内挂载本地文件夹?
- sql - 使用存档列限制 MS SQL DB 索引大小