首页 > 技术文章 > 总体和样本

fuyusheng 2020-05-09 21:41 原文

一、点估计量

在某些情况下,我们并不知道总体参数的确切数值,只能通过样本估计总体参数。

点估计量就是通过样本对于总体参数的最佳猜测值

例如:总体均值    总体均值点估计量 

 

二、估计总体均值(样本估计总体)

在已知情况下,样本均值是我们能为总体均值做出的最好估计-样本均值是最有可能被作为总体均值的数值。

样本均值可作为总体均值的点估计量,记为: = (样本均值)。

 

三、估计总体方差(样本估计总体)

由于样本比较与总体,数值数量变少,因此,与总体中数值偏离于均值的程度相比,样本中的数值更有可能更加密集在均值周围。

所以,样本数据的方差不是总体方差的最好估计方法,如果用样本方差估计总体方差,估计结果会稍微偏低。

通常,如果样本大小为n,可以用下面算式估计总体方差:

   当需要估计总体方差时,样本数减-1

 

四、估计总体比例(样本估计总体)

如果用代表样本样本比例,则可以用下式估计总体比例:

 , 代表总体比例的点估计量。

 

五、比例的抽样分布(总体估计样本)

总体比例p已知时,需要考虑大小为n的样本,得出所有样本比例的分布,该分布称作为“比例的抽样分布”或者“的分布”。

推导:

条件:总体糖球样本中红色糖球比例为p,样本大小为n。

随机变量X代表样本中红色糖球的数目,X~B(n,p)。红色糖球比例取决于X,即比例可作为另一随机变量X/n记作为

期望:E() = E(X/n) = E(X)/n, X服从二项分布即E(X)=np,于是E()=p。

结果符合预期,我们期望样本中比例与总体比例相一致。

方差:Var() = Var(X/n)=Var(X)/n2=npq/n2=pq/n。

分布:当n越大时,的分布越接近正态分布,通常认为n>30时,符合正态分布,此时 ~ N(p, pq/n)。

应用:可通过的分布计算样本比例至少为某值的概率。

连续性修正:在利用正态分布计算概率时,需要进行连续性修正提高正确率,修正值为 +-1/2n。

比例的抽样分布用处:求出已知总体中取出某个样本比例的概率

 

六、均值的抽样分布(总体估计样本)

当已知总体均值和方差,需要考虑大小为n的样本,得出所有样本均值形成的分布,叫做“均值的抽样分布”,或者的分布。

推导:已知袋装糖球总体,均值和方差,一个包装袋糖球数量用X 表示,每一袋糖球都符合相同分布,用Xi代表随机选择一袋糖球中的糖球数量,均值和方差

取n包糖球作为样本,X1到Xn表示包装袋中糖球数量,表示n袋糖球的容量均值。

期望:E() = E(X1+X2+...+Xn/n) = 1/n(E(X1)+E(X2)+..+E(Xn)) = 1/n(n) = 

结果样本量为n的均值符合总体均值。

方差:Var() = Var(X1+X2+...+Xn/n) = 1/n2(n) = /n

分布

  • X符合正态正态分布X~N(,) 则符合正态分布~N(,/n)
  • n很大时,可以用正态分布近似~N(,/n)(中心极限定理:如果从一个非正态总体X中取出一个样本,且样本很大>30,则的分布近似为正态分布)

应用:均值的抽样分布为我们提供了一种计算样本均值的概率的方法。

 

2020-0509-21:40

 

推荐阅读