重抽样和自助法
使用场合:数据抽样分布于未知或者混合分布,样本量过小,存在离群点,基于理论分布设计合适的统计检验过于复杂且数学上难以处理等。
1.置换检验
1.1置换检验举例
假设有两种处理条件的实验,有十个受试者被随机地分配到其中一个条件(A或者B),A种处理条件所得结果为:40,57,45,55,58;B种处理条件所得处理结果为:57,64,55,62,65。如果想知道两种处理方法对实验结果的影响是否相同。
在参数方法中,假设数据抽样自等方差的正态分布,然后使用T检验来验证结果。置换检验的思路与之不同,如果两种处理方式真的等价,那么分配给观测得分的标签便是任意的(A处理或者B处理),为检验两种处理方式的差异,我们可遵循如下步骤:
(1)与参数方法类似,计算观测数据中的T 统计量,称为t0;(2)将10个得分放在一个组中;(3)随机分配五个得分到A处理中,并分配五个得分到B处理中;再次计算T统计量;这样有可能有=252种(4)将这252个t统计量按升序排列,这便是基于样本数据的经验分布;(5)如果t0落在经验分布95%部分的外面,那么在0.05的显著性水平下,拒绝两个处理组的均值相等的假设。
置换检验和参数方法都用到了T统计量,但置换方法并不是将统计量与理论分布比较,而是将其与置换观测数据后获得的经验分布比较,根据统计量的极端性判断是否有足够理由拒绝零假设。这种逻辑可以延伸到大部分经典统计检验和线性模型上来。在先前的例子中,经验分布依据的是数据所有的可能排列组合(252种),此时置换检验称为“精确检验”,随着样本量的增加,获取所有可能排列的时间开销会非常大。这种情况下,你可以使用蒙特卡洛模拟,从所有可能的排列中抽样,获得一个近似检验。
1.2用coin包做置换检验
(2)











网友评论