featuretools - 您如何使用特征工具检测或控制变量的危险使用及其转换?
问题描述
当您在购买日期应用转换年、月或日时,您很容易遇到问题!
假设您购买的是 2018 年,但您想在 2019 年的数据上应用模型。模型是使用特征工具自动生成的特征开发的,包括像年份这样的简单转换。
这里的问题是模型不知道2019!?这意味着该模型不适用于新数据。
解决方案
我不相信你提供的案例有问题。新闻年数据允许提取年、月、日的特征工程计算。只要您不使用您试图预测的未来数据来训练您的模型,您就会没事的,因为您不会将任何关于未来的信息泄露到您的训练过程中。
推荐阅读
- syntax - 如何在 SystemVerilog 中将解压后的类型显示/打印为十六进制?
- codeigniter - 不显示错误但不更新 codeigniter 中的数据
- r - DT::datatable 中的 SelectizeInput 只能用作 html
- python - Python:继承中的“自我”
- r - data.table 等效于:case_when - 在其上使用电子邮件时正则表达式无效?
- oracle - 如何通过模式或其他可能性限制 DBA_AUDIT_TRAIL 活动可见性以查看目标模式的活动
- paypal - PayPal 智能按钮借记卡或信用卡功能 - 显示金额
- dataframe - PySpark - 使用正则表达式反透视数据框
- node.js - Lambda 函数 errorMessage”:“无法读取未定义的属性 'bucket'
- vmware - VMWare:关于快照:它们通常会占用多少% 的磁盘空间源VM?他们是否习惯于降级软件?