python - 是否可以安装 sklearn 管道的单独部分?
问题描述
考虑使用以下 sklearn Pipeline
:
pipeline = make_pipeline(
TfidfVectorizer(),
LinearRegression()
)
我已经接受过TfidfVectorizer
预训练,所以当我打电话时,pipeline.fit(X, y)
我只想LinearRegression
安装而不想改装TfidfVectorizer
。
我可以提前应用转换并适应LinearRegression
转换后的数据,但在我的项目中,我有很多转换器在管道中,其中一些是预训练的,有些不是,所以我正在寻找一种方法围绕 sklearn 估计器编写另一个包装器并保持在一个Pipeline
对象的范围内。
在我看来,它应该是 estimators 对象中的一个参数,代表在调用.fit()
对象是否已安装时不重新安装对象。
解决方案
查看“内存”参数。它缓存来自管道的转换器。
https://scikit-learn.org/stable/modules/generated/sklearn.pipeline.make_pipeline.html
pipeline = make_pipeline(
TfidfVectorizer(),
LinearRegression(),
memory='cache_directory'
)
推荐阅读
- angular-flex-layout - 有条件地使用角度弹性布局?
- reactjs - SyntaxError:ScriptTransformer._transformAndBuildScript 处的意外令牌导入
- javascript - Jquery-日期转换问题
- c# - 统一生成对象
- javascript - 向浏览器输出响应
- mongodb - 使用 MongoEngineObjectType 使 ID 字段成为必需
- javascript - 从子组件更新父组件的对象数组的正确方法是什么?
- ios - iOS Swift 如何检测登录错误原因以向用户显示正确的错误警报
- node.js - 在 nodejs 中拆分和重建文件会通过某些格式更改其长度
- android - Android camera2 图像方向问题