首页 > 解决方案 > 预测跳远结果:这是时间序列预测问题还是回归问题?

问题描述

这是我的数据(简化):

Athletics    Age    Competition    Result(m)
--------------------------------------------
Alex         10.2    CompA          3.2
Alex         11.5    CompB          4.3
...
Bob          9.9     CompC          3.5
Bob          10.7    CompD          5.6
...
Dave         10.3    CompB          5.2
Dave         11.6    CompD          6.3
....

所以我的数据是关于一组不同年龄(8-28岁)的孩子在不同比赛中跳远的结果。

我想知道的:

  1. 给一个新的孩子保罗,如果我们知道他的历史(例如 8 - 16 岁),如何预测他未来的结果(比如 18、20、24 岁)?
  2. 如果我们可以根据他们的最佳成绩将跳投者分组到 AE 中,那么如何预测保罗将来会在哪个组中(比如他 18 岁时)?

我最近了解了一些关于机器学习和深度学习的知识,我知道这是一个可以使用这些模型解决的问题,但我很困惑我应该使用哪些模型。

  1. 我是否应该仅根据保罗的历史数据对保罗(新生儿)进行预测?或者我应该使用其他人的数据,比如 Alex、Bob、Dave?
  2. 这是一个时间序列预测问题,我应该使用 ARIMA、ARCH、LSTM (RNN) 等模型吗?
  3. 或者这是一个“正常”的监督或非监督回归或分类问题,我应该使用线性回归、逻辑回归、KNN、NB、DT、SVM、随机森林、ANN、DNN、CNN 等教科书模型?

任何方向将不胜感激。

标签: machine-learningmodeltime-series

解决方案


您尝试解决的问题通常称为面板(或监督)预测。

是否使用其他孩子的数据是一个实际问题。您可以将使用数据的模型与仅使用 Paul 数据的模型进行比较。

没有必要使用深度学习,但你当然可以尝试。其他标准机器学习算法(随机森林等)或统计预测算法(ARIMA 等)也可以适用于解决此类问题。

很少有现成的库可以解决这个问题。一个是带有天气数据教程的 pysf(https://github.com/alan-turing-institute/pysf/blob/master/examples/Walkthrough.ipynb),另一个是 gluon-ts(主要是深度学习方法) .


推荐阅读