首页 > 解决方案 > 如何处理机器学习中的异步输入

问题描述

考虑我正在构建一个使用来自两个不同表的患者数据的预测模型。

第一个表是NURSE_OBSERVATIONS,它有 3 列:

第二个表是LIQUID_FOLLOW,它也有 3 列:

我的模型使用两个表作为输入。因此,我的输入向量的大小为 6。每当护士为两个表输入值时,都会触发我的模型并进行预测。但是,有几个问题:

  1. 数据输入不同步。护士观察每天输入 6 次,但液体数据每天输入两次,因此存在不匹配。我想在每次输入液体数据时触发模型,但仅使用最后一次护士观察数据会丢失以前的测量值。
  2. 护士并不急于使用该软件输入数据,因此某些行可能缺少数据。例如,护士可以输入 Fever 和 Blood Pressure,但跳过 Pulse_Rate,反之亦然。

我们如何为这种异步数据输入建立模型?如果我们用静态输入向量构建模型,比如深度神经网络,那么缺失数据会给我们带来维度不匹配错误。我们可以使用 seq2seq 模型吗?

如果需要,我可以添加更多信息。

Ps:请记住,缺失的数据可能会有所不同(可能是发烧,另一排是血压)

标签: pythonmachine-learningdeep-learningartificial-intelligencedata-analysis

解决方案


推荐阅读