data-mining - 稍后添加新功能时处理“丢失”数据
问题描述
条件:
我有具有 2 个特征的数据集
每天我都会收集新数据。所以行数增加了
我已经收集了 1000 天的数据,所以我有 1000 行
我在第 900 天添加了新功能(功能 3)
我无法获取过去的数据。
问题是我有不同的行:
特征 1 和特征 2 有 1000 行
特征 3 有 100 行
什么是最好的解决方案?我应该做估算吗?我应该制作多个子集吗?
我认为这种情况会再次发生,因为我有计划在未来再次添加新功能(功能 4、功能 5 等)
解决方案
没有适合所有人的解决方案。
在某些情况下,丢弃旧数据可能会很好。
插补可能不是一个好主意。我宁愿使用一种可以忽略缺失值的算法。
推荐阅读
- c# - GCP Google Cloud Platform - Cloud Run - .NET 5.0 - 来自秘密或转换 appsettings.json 的应用程序设置
- docker-compose - 在普罗米修斯中无法获得正确的实例名称
- javascript - 这两个逻辑运算符条件相同吗?
- docker - VSCODE 扩展远程容器不允许我使用“workspaceMount”
- python - SQLParse 删除注释后截断剩余的 sql
- php - 有没有办法获取 CDATA 的值并在 php 中转换为 json 或数组格式?
- azure - 将 ManagedID 分配给 KeyVault 访问策略
- python - 在 Selenium 映像更新后,Pytest 无限期挂起运行测试
- javascript - 如何更改 React quill 中的颜色选择器图标?
- javascript - 错误类型错误:无法读取 null 的属性(读取“toISOString”)