首页 > 解决方案 > T 检验和从列中导入数据

问题描述

我正在尝试使用以下代码对两个不相等的样本进行 T 检验。

import pandas as pd
import numpy as np
from scipy import stats

UG = pd.read_csv('Mostfrequentscores.csv')
print('Mean', UG['Iceland'].mean())
print('Mean', UG['Peru'].mean())

I = UG['Iceland']
P = UG['Peru']

t = stats.ttest_ind(I, P, equal_var = False)

平均值打印得很好,我认为这意味着它读取文件中的列 - 但 T 测试不断给我以下错误:

C:\Users\msu\Anaconda3\lib\site-packages\scipy\stats_distn_infrastructure.py:879:RuntimeWarning:在更大范围内遇到无效值

这可能是由于我的数据是从 -3 到 3 的一系列数字吗?我需要使用浮点数转换它吗?

标签: pythonpandasscipyprobabilityt-test

解决方案


推荐阅读