apache-spark - 为 Spark MLlib 管道设置自定义参数
问题描述
默认情况下,Spark MLlib 管道有一个参数:stages
. Params 机制从 trait 引入到Pipeline
类中Params
(通过 abstract PipelineStage
)。理论上,应该可以使用 设置其他参数Pipeline.set(String name, String value)
,但这仅适用于 Pipeline 对象已知的参数。否则,抛出异常,例如
pipeline.set("Hello", "World!")
你会得到
java.util.NoSuchElementException: Param Hello does not exist.
是否有另一种方法可以在 Spark 管道中设置自定义参数,这些参数在保存经过训练的管道时也会导出?我想用它来对训练有素的 ML 模型进行版本控制和存储其他元数据,最好不必围绕 Spark 管道对象创建额外的包装器。
解决方案
推荐阅读
- spring - 在回滚的测试中手动执行事务中的代码
- amazon-web-services - 查看器请求和查看器响应的单个 Lambda@Edge 函数调用
- javascript - 内容丰富的 JS:无法通过匹配参考字段来检索条目
- python - 如何扩大数据框 - 熊猫
- javascript - 如何在javascript中用“”(空格)替换字符串中长度小于3的所有单词?
- javascript - svg.js 中的动画没有相同的结果
- python - 将数据框值作为参数添加到 sql 查询
- selenium - 为 Safari 运行机器人框架脚本时出现问题
- android - 如何从浏览器打开我的 React Native 应用程序?
- oracle - PL/SQL:测试返回布尔值的函数