r - 计算校正因子
问题描述
我有一个我怀疑受温度影响的变量,我想计算一个解释温度影响的校正因子。
所以给出一个时间序列的温度数据:
Temp<-c(23.545, 23.475, 23.382, 23.328, 23.251, 23.247, 23.241, 23.227, 23.146,
23.133, 23.127, 23.567, 23.561, 23.521, 23.496, 23.348, 23.274, 23.270,
23.258, 23.244, 23.158, 23.152, 23.132, 23.123, 23.083, 23.025, 22.999,
22.666, 22.330, 22.072, 21.794, 21.532, 21.063, 20.742, 19.183, 18.556,
17.165, 15.233, 13.844, 12.818, 12.236, 11.914)
和有问题的变量:
var<-c(0.080, -0.003, -0.018, -0.035, 0.005, -0.023, 0.080, 0.035, 0.065,
-0.055, -0.030, -0.038, 0.010, 0.013, 0.018, -0.033, -0.028, 0.105,
-0.085, 0.010, 0.018, -0.065, -0.048, -0.013, -0.103, -0.013, 0.002,
0.053, -0.018, 0.080, 0.057, 0.083, 0.060, 0.085, 0.158, 0.155,
0.232, 0.245, 0.390, 0.400, 0.568, 0.508)
我可以将两者绘制在一起以查看 temp 对 var 的影响
plot(Temp,var)
我在 22.330 有一个 Temp 观察值,我知道它是正确的。所以我想根据某种校正因子调整 var 数据,方法是假设:
A - 所有的 var 值都接近相同的值,大部分差异是由于 temp
B- 22.330 点是正确的,上下值应相应修正
解决方案
也许这里是一个起点。
让我们从拟合线性模型开始var ~ Temp
fit <- lm(var ~ Temp)
除了人为地强制模型通过一个/多个特定点之外,我看不到使用加权线性模型的意义。数据就是它们的样子,形式的线性模型将表征和var ~ Temp
之间的一般线性相关性。var
Temp
让我们合并 a 中的数据data.frame
,并添加一Time
列以及线性模型拟合的残差。
df <- cbind.data.frame(Time = 1:length(Temp), Temp, var, resid = fit$residuals)
我们展示了以下图表:
library(gridExtra)
gg1 <- ggplot(df, aes(Time, var)) + geom_point()
gg2 <- ggplot(df, aes(Temp, var)) + geom_point()
gg3 <- ggplot(df, aes(Time, resid)) + geom_point()
grid.arrange(gg1, gg2, gg3, nrow = 1)
- 左侧面板显示了 on 的依赖
var
关系Time
。 - 中间面板显示了您假设存在的
var
on的依赖关系。Temp
- 右图显示了在我们对on的线性相关性进行校正后
var
on的残余影响。Time
var
Temp
换句话说,您可以将残差视为var
校正后的值Temp
。var
他们描述了无法解释的可变性Temp
。
推荐阅读
- rpa - 如何解决打开浏览器:列“列名”不属于表DataTable。在 UIPath
- google-apps-script - 脚本帮助移动单元格值
- java - 如何在 Java Project Intellij 中将模块依赖添加到其他模块
- dataframe - 将 Spark DataFrame 转换为 spark.rdd.RDD[(Array[Integer], Array[Integer]) 以计算平均精度
- c# - 这个 SQL 数据表有什么解决方法吗?
- react-native - 通过视图反应原生导航
- python - 由于大量代码,Django 加载页面缓慢
- reactjs - 如何在reactjs中的react-multi-select-component中设置动态选择项
- javascript - 有没有办法从 Vue.js 的列表中只检查一个复选框
- html - 使用 string.replace 编辑后从 json 文件中删除反斜杠字符