首页 > 解决方案 > R中多行的T检验

问题描述

我有一张有 40 多列和 200.000 多行的表。像这样的东西:

ID GROUP-A1 GROUP-A2 GROUP A3...A20   GROUP-B1 GROUP-B2 GROUP-B3...B20
1  5        6        3     5....3     10       21       9          15
2  3        4        6     2....13    23       42       34         23
3  5        3        1     0....12    10       12       43         15 
4  0        0        2     5....3     10       21       23         15 

我想为我拥有的每个测量值(每行)对两组 A (1..20) 和 B (1..20) 进行 t 检验,它们是独立的。并且可能,将生成的统计信息放在每行旁边的表格中或单独的表格中,以便我可以轻松选择重要的统计信息。

我查看了几个 R 包,但它们大多需要重新格式化我拥有的表格,将测量值和组放在列中,在这种情况下,我需要 200.000 多个单独的表格。

任何的想法?

标签: rstatisticst-test

解决方案


像这样的东西?

apply(df,1,function(x){t.test(x[2:21],x[22:41])})

要将测试统计量或 p 值保存在新列中,您可以这样做

df$st=apply(df,1,function(x){t.test(x[2:21],x[22:41])$stat})

或者$p.value


推荐阅读