r - R中GAM模型中基因组变量的空间自相关
问题描述
我有一个关于在对基因变量进行建模时需要使用一些空间校正的问题。
我拥有的变量是:
Chr、gene_start、gene_end、number_of_bases_with_info、diversity_before、diversity_after、delta_diversity、重组、分歧、GC_content、selection_coefficient。
我的响应变量是:多样性损失(delta_diversity),即diversity_before-diversity_after。
我的解释变量是:重组、分歧、GC_content 和选择系数。
但是,我也在考虑开始时的多样性(diversity_before),因为多样性的损失可能取决于初始多样性和 number_of_bases_with_info,理想情况下应该是gene_end-gene_start,但有时我们缺乏某些位置的信息,因此,可能会更少。
现在我的代码如下所示:
library(mgcv)
model <- gam (delta_diversity ~
s(number_of_bases_with_info, bs="tp", k=10) +
s(diversity_before, bs="tp", k=10) +
s(recombination, bs="tp", k=10, m=2)+
s(divergence, bs="tp", k=10)+
s(GC_content, bs="tp", k=10)+
s(selection_coefficient, bs="tp", k=10),
# Dataframe
data=dataframe,
# Method and family
method="REML", family="gaussian")
但是,我的残差图看起来很糟糕!
我想知道不考虑空间自相关是否对这些模式有任何影响,以及如何考虑它,因为据我所知,通常的方法是:
corExp(form=~Latitude + Longitude)
这在这里不适用,因为我在一个 chr 中有坐标(从位置 x 到位置 y)。
我的问题是:
难道不考虑空间相关性是造成这种奇怪的残差模式的原因吗?
我应该考虑它,如何考虑?
关于为什么我的残差看起来如此奇怪或如何改进我的模型的任何其他输入都非常受欢迎。
解决方案
推荐阅读
- python-3.x - O(n) 字符串中单词列表的出现次数
- python - 如何从 PyTorch 网络中的稀疏矩阵中获取反向梯度?
- python - Python转换PDF
- python-3.x - 有没有人成功编译过 python 3 Kivy 应用程序?
- node.js - 使用 rxjs ajax() 我得到“你的浏览器不支持CORS”
- sqldatasource - 在我的 SqlDataSource 标记中使用全局变量
- angular - 页面加载时角度动画淡入
- avplayerviewcontroller - 如何改变 AVPlayerViewController 的速度?
- java - Java评估多个布尔参数是否相等
- php - 在作业中实现存储库接口