置信区间

源自样本统计量并有可能包含未知总体参数值的值范围。由于它们的随机性,来自给定总体的两个样本一般不可能生成相同的置信区间。但是如果将样本重复许多次,则所获得的特定百分比的置信区间会包含未知的总体参数。这些包含参数的置信区间的百分比是区间的置信水平。

例如,假设您想知道汽车装配线完成一辆车所需的平均时间。您抽取一个完工汽车的样本,记录它们在装配线上所用的时间,然后使用单样本 t 过程获得一个所有汽车在装配线上所用平均时间量的 95% 置信区间。由于从所有可能的样本构造的置信区间中有 95% 的置信区间会包含总体参数,因而可以断定所有汽车在装配线上所用平均时间量将落在区间端点之间,这些端点称为区间限。

创建置信区间类似于向一个具有未知但固定位置的目标撒网。请看下面的图示,它描述了由来自同一总体的 20 个样本生成的置信区间。黑线代表未知总体参数的固定值;蓝色置信区间包含总体参数的值;红色置信区间未包含。

95% 置信区间表明来自同一总体的 20 个样本中有 19 个 (95%) 会生成包含总体参数的置信区间。