python-3.x - 用于数据预处理的 Pickle
问题描述
我正在阅读有关在 ml 模型上使用 pickle 的各种教程和文章,以便以后可以使用。但是我无法获得用于数据预处理的泡菜或类似的东西。我正在做预处理:
- 更改少数列/功能的数据类型。
- 特征工程。
- 热编码/虚拟变量
使用以下代码缩放数据
从 sklearn.preprocessing 导入 StandardScaler
sc = StandardScaler() X_train = sc.fit_transform(X_train) X_test = sc.transform(X_test)
现在,我想对我传递给预测的每个数据集执行此操作。在我从 pickle 加载 ML 模型之前,有什么方法可以像 pickle 一样加载数据预处理步骤。
请指导
解决方案
我创建了一个函数并将其保存为一个独立的文件。然后在需要时调用该函数。
下面是我如何调用数据预处理函数的代码
from DataPreparationv3 import Data_Preprocess
Base_Data = pd.read_csv('Validate.csv')
DataReady = Data_Preprocess(Base_Data)
这解决了我的问题。
问候
苏迪尔
推荐阅读
- python - 动态 CSS 选择器如何与 Beautiful Soup 一起使用?
- php - 变量未检测为数组
- python - 在单独的 python 线程中运行一个函数
- javascript - async/await 未返回与 console.log 记录的对象相同的对象
- c# - Container 的 ReadItemAsync 无法解析 Stack
正确实例 - r - R:匹配和重复出现
- linux - 安装失败
- java - 如果我们在 java 接口中不能有构造函数,那么这是什么?
- java - Optional/Stream的中间操作中如何处理NPE?
- python - 如何在熊猫中聚合和分组