python - CoreML - 多数组输入需要在应用程序或模型中进行预处理?
问题描述
我已经使用这个库来构建音频分类模型。然后我将此模型转换为 CoreML。后来想在这段代码中实现模型https://github.com/robmsmt/kDS2iOS/
我对此有疑问,因为模型的输入是 Double MultiArray (1 x 96 x 435),并且代码采用不同的形式。所以我认为我有两个选择之一,但如果我错了,请纠正我,我可以在应用程序中进行录制,并通过预处理应用程序中的音频文件使其适合模型来按照应用程序的方式进行操作。我不确定是否可能的另一个选项是让原始模型接受音频,这样我就不必在 python 中编写预处理代码两次,而在 xCode 中编写另一个。有人可以告诉我该怎么做吗?
解决方案
这取决于预处理是什么。Core ML 可以进行某些类型的预处理(例如规范化输入),但您仍然需要自己将音频数据加载到 MLMultiArray 中(因为 Core ML 没有“音频”输入)。
推荐阅读
- google-cloud-firestore - Javascript Firestore 客户端是否缓存文档引用?
- c# - 带有 .NET Framework 的 AWS Lambda 函数
- r - 在 dplyr 中,如何根据某一列是否在数据框中选择和过滤不同的列?
- scala - vert.x scala 可以热重载吗?
- java - JavaFX 为 GridPane 中的项目设置边距
- python - 通过 Django 中的 api 在多对多字段中添加新项目
- google-sheets - 在 Google 电子表格中使用趋势线预测 LTV
- python - 如何使用现有的元组列表创建新的元组列表
- tensorflow - 为什么偏置层形状不等于具有自定义层的自定义模型中的权重层形状
- r - ggplot2 | 如何自定义图例中字符串值的顺序?