python - 在 Python 中填充缺失值
问题描述
我有一个看起来像这样的数据框。
Subject Level Age Dosage
1 Beta 27 2
2 Alpha 19 3
3 Alpha 13 5
还有一个看起来像这样的数据框。
Subject Level Age
4 Beta 18
5 Beta 26
6 Alpha 17
7 Beta 27
我想要的结果是第二个数据框,其中预测的剂量数看起来像这样。
Subject Level Age Pred_Dosage
4 Beta 18 4
5 Beta 26 3
6 Alpha 17 1
7 Beta 27 3
基本上,我想使用第一个数据帧来预测第二个数据帧的剂量字段值。我在想随机森林回归器是正确的方法,但是还有其他方法吗?
解决方案
由于要预测的剂量是一个定量变量,因此您需要一个回归算法。其中许多是可用的,例如,请参见此处。您还应该提及训练数据框中有多少行可用。此外,您应该确认只有 2 个预测变量(级别和年龄)。这些因素可能会影响算法的选择。
您也可以先进行单变量分析,以确定剂量与水平和年龄之间是否存在显着关系。剂量是由一个、两个或一个预测变量预测的,都可能会影响您的模型。
还应该清楚的是,每一行都属于一个不同的主题,并且没有对主题的重复测试。
只有一个分类预测变量和一个数字预测变量,还可以制作散点图,X 轴为年龄,y 轴为剂量。Alpha 和 Beta 的点可以用不同的颜色着色,并且可以分别为 Alpha 和 Beta 绘制回归线。这也将有助于创建一个好的模型。
推荐阅读
- android - 如何让 Android HttpURLConnection 处理重定向
- sql-server - 顺便说一句,使用 CTE、视图和子查询是否有任何性能差异?
- reactjs - 当条件失败时,React 呈现 0
- css - 无法让照片响应
- algorithm - 基于数据连续性的排序
- visual-studio-2017 - 在 Visual Studio Professional 2017 中,在“显示潜在修复”之后使用“生成方法”,如何生成没有正文的方法存根
- java - JPanel 中带有 FlowLayout 的 JPanel 中带有 GridBagLayout 的 JPanel 未正确锚定
- android - 使用 Retrofit 解析 JSON 中的特定值
- javascript - 如何链接获取请求并将两者的结果连接到数组 JS/Node
- ios - Firebase Realtime Database doesn't save data from sign up page