apache-spark - MLeap 实际上是一种序列化“格式”吗?
问题描述
我开始使用MLeap作为序列化工具,它允许将模型保存在 Spark 或 scikit-learn 中,并使用MLeap Runtime加载它进行推理。它运作良好。
现在我的目的是将使用 MLeap 保存的模型加载到我的 Java 代码中,加载到我自己的结构中,而无需 MLeap 运行时。我调查了一下,没有找到“模式”的任何“格式定义”,只有一些例子展示了一些序列化模型的样子。从这个角度来看,MLeap 看起来只是一个序列化/反序列化工具,而不是文档主页上声明的“格式”。
那么,MLeap 是一种“格式”还是只是一种序列化工具?我可以在某处找到格式定义或架构吗?
同样,我的目的是了解是否可以为 MLeap格式编写自定义序列化/反序列化工具,或者唯一的选择是为此使用 MLeap 工具?
解决方案
我想说,Mleap 是一个框架,可以将模型投入生产,而不需要你训练它们的框架的开销。这导致所需的低延迟。反序列化绝对是其中的一个重要部分,实际上您可以自由地存储您的管道。
我建议查看您使用 Mleap 创建的包含导出管道的包(zip 文件)。大多数序列化很容易理解:逻辑回归包含在一个 jsonfile 中,例如,它具有管道元素的标识符和系数。基本上是什么定义了逻辑回归模型。
推荐阅读
- python - Scrapy 超时和 Twisted.Internet.Error
- django - Django - 自定义 ModelMultipleChoiceField 无法根据父模型对选择进行分类
- javascript - Chart.js 圆环图,沿路径/笔划渐变
- python - 如何让我的函数在 elif 语句后返回到代码中的某个点?
- typescript - 将您的类型与现有的 Typescript 合并
- azure - Azure Ad B2C IDX20804:无法从中检索文档
- java - 如何在 Java 中为滚动游戏制作简单的跳跃动画?
- bash - 在 bash 中添加数字(在 zsh 中工作)
- cloud - 在 s7-1200 PLC 和 MS Azure 之间建立通信的方法
- typescript - 尝试使用仅特定类型的字段创建子类型,然后创建一个类型,该类型是该子类型的键