首页 > 解决方案 > R中GAM模型中基因组变量的空间自相关

问题描述

我有一个关于在对基因变量进行建模时需要使用一些空间校正的问题。

我拥有的变量是:

Chr、gene_start、gene_end、number_of_bases_with_info、diversity_before、diversity_after、delta_diversity、重组、分歧、GC_content、selection_coefficient。

我的响应变量是:多样性损失(delta_diversity),即diversity_before-diversity_after。

我的解释变量是:重组、分歧、GC_content 和选择系数。

但是,我也在考虑开始时的多样性(diversity_before),因为多样性的损失可能取决于初始多样性和 number_of_bases_with_info,理想情况下应该是gene_end-gene_start,但有时我们缺乏某些位置的信息,因此,可能会更少。

现在我的代码如下所示:

library(mgcv)

    model <- gam (delta_diversity ~
                        s(number_of_bases_with_info, bs="tp", k=10) +
                        s(diversity_before,  bs="tp", k=10) +
                        s(recombination, bs="tp", k=10, m=2)+
                        s(divergence,  bs="tp", k=10)+
                        s(GC_content,  bs="tp", k=10)+
                        s(selection_coefficient,  bs="tp", k=10),
                        # Dataframe
                        data=dataframe,  
                        # Method and family
                        method="REML", family="gaussian")

但是,我的残差图看起来很糟糕!

在此处输入图像描述

我想知道不考虑空间自相关是否对这些模式有任何影响,以及如何考虑它,因为据我所知,通常的方法是:

corExp(form=~Latitude + Longitude)

这在这里不适用,因为我在一个 chr 中有坐标(从位置 x 到位置 y)。

我的问题是:

难道不考虑空间相关性是造成这种奇怪的残差模式的原因吗?

我应该考虑它,如何考虑?

关于为什么我的残差看起来如此奇怪或如何改进我的模型的任何其他输入都非常受欢迎。

标签: rspatialmodelinggamgenome

解决方案


推荐阅读