1. 计算公式
---> 数据集合中的某个值
---> 均值
n ---> 总体数量
离均差: 每个数值与数据集均值之间的差,可能存在负数。常用于衡量数值之间的差异性。
公式: 离均差 =
平均绝对偏差:离均差的绝对值的平均值。离均差中存在负数的情况,防止相加导致的数据对消,所以采用离均差的绝对值的方式。
公式:
平方偏差:离均差的平方
公式:
平方和:平方偏差的数值和
公式:
标准偏差:平方和的均值
公式:
2. 标准偏差的重要性
标准偏差的意义:大约68%的数据与平均值的偏差不超过一个 (即一个偏差) 。大于95%的数据与平均值的偏差不超过 2
(即2个偏差)。下图所示:
3. 贝塞尔校正
通常抽样中总会低估了总体中差异性的数量。因为大部分数据居于中间位置。特别是正态分布中。为了纠正这一现象,我们采用 n -1 的方式,使s的值稍大一些,趋向于 。即:











网友评论