python - 有没有一种使用内部元素很少的多个数据框进行预测的方法?
问题描述
我正在研究时间序列,但我不确定如何解决我的问题。
问题:预测 2021 年价值 X。
数据。我有 4k 个这种形状的数据集:(每个客户 1 个)
TS | 客户ID | 价值X | 特色1 | 特色2 | 特色3 | 特色4 |
---|---|---|---|---|---|---|
2019-01-01 | 客户1 | 1000 美元 | 1 | 12000 | 0.6 | 1 |
2019-02-01 | 客户1 | 850 美元 | 3 | 4000 | 0.8 | 10 |
... | ... | ... | ... | ... | ... | ... |
2021-06-01 | 客户1 | 1040 美元 | 3 | 10000 | 0.6 | 8 |
2021-07-01 | 客户1 | 1305 美元 | 2 | 5000 | 0.5 | 6 |
所有 4000 个数据集包含 2019 年、2020 年和 2021 年一半的所有列。
问题是: 假设每个客户的系列趋势/周期非常相似,我怎么能猜出我知道他从 2019-01-01 到 2020-31-01 的数据的新客户每个月的 2021 ValueX。
我想如何解决它:使用 ML 我想传递我的 n 个数据集来“训练模型”,然后以这种方式在一些剩余的数据集上对其进行测试:使用 2019 年 1 月的已知值像基础一样使用该模型 → 2020-31 根据特定客户数据校准模型。那可能吗?它可以工作吗?
感谢您提供任何帮助,提示或教程或任何东西:) 干杯
解决方案
推荐阅读
- java - 是否可以在不使用模拟框架的情况下测试方法是否被调用
- c# - 如何从 zkteco 获取用户照片?
- ios - IOS键盘在网络输入时随机消失
- python - 不从自定义视图/表单将 **kwargs 传递给 django-import-export 资源
- tensorflow - Tensorflow,Keras:如何解决“Dimension must be equal, but are ...”一般错误
- python - Pandas - 如何组合来自文本文件的多个数据框并保存到每个输出文件
- python - Flask Sql-Alchemy,sqlalchemy.exc.OperationalError:(psycopg2.OperationalError)致命:用户“abc”的 PAM 身份验证失败
- python-3.x - 正则表达式检查字符串中是否存在一个或多个特殊字符
- c++ - 如何将变量初始化为附加到播放器的相机组件的指针
- python - 当列不为空时,pandas to_excel 问题给出索引空错误