搜索
您的当前位置:首页正文

随机分组原理与方法案例

来源:六九路网
随机分组原理与⽅法案例

简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独⽴,彼此间⽆⼀定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较⼩和数⽬较少时,才采⽤这种⽅法。

适⽤于总体量⼤、差异程度较⼤的情况。先将总体单位按其差异程度或某⼀特征分类、分层,然后在各类或每层中再随机抽取样本单位。分层抽样实际上是科学分组、或分类与随机原则的结合。分层抽样有等⽐抽样和不等⽐抽样之分,当总数各类差别过⼤时,可采⽤不等⽐抽样。除了分层或分类外,其组织⽅式与简单随机抽样和等距抽样相同。随机抽样设计

⼀、纯随机抽样:对总体的所有容量不做任何的分类和排队,完全按随机原则逐个抽取样本容量。纯随机抽样的常⽤抽样⽅法

1)抽签法:将总体容量全部加以编号,并编成相应的号签,然后将号签充分混合后逐个抽取,直到抽到预定需要的样本容量为⽌。

缺点:总体容量很多时,编制号签的⼯作量很⼤,且很难掺和均匀。

2)随机数字法:⽤字母顺序或⾝份证号等任何⽅便的⽅法对总体容量编者按号,利⽤随机数表从1到总体容量N中随机抽取n(样本容量数)个数,遇到那些不在编号⾥的数字需跳过。

⼆、等距抽样:先将总体各单位按某⼀有关标志(或⽆关标志)排队,然后相等距离或相等间隔抽取样本单位。根据需要抽取的样本单位数(n)和全及总体单位数(N),可以计算出抽取各个样本单位之间的距离和间隔,即:K=N/n,然后按此间隔依次抽取必要的样本单位。等距抽样的⼀个例⼦

某企业有职⼯5000名,现要随机抽取100⼈进⾏家庭收⼊⽔平调查。

抽取⽅法:按与研究⽬的⽆直接关系的姓名笔划对总体进⾏排列,把总体划分为

K=5000/100=50个相等的间隔,在第1⾄第50⼈中随机抽取⼀名,如抽到第10名,后⾯间隔依次抽取第60,110,160,210,…直到4960为⽌,总共抽取50同名职⼯组成⼀个抽样总体。

等距抽样的优点:(1)能保证被抽取到的样本单位在全及总体中均匀分布;(2)简化抽样过程。等距抽样应注意:要避免抽样间隔或样本距离和现象本⾝的节奏性或循环周期相重合。三、类型抽样

类型抽样:将全及总体中的所有单位按某⼀主要标志分组,然后在各组中采⽤纯随机抽样或等距抽样⽅式,抽取⼀定数⽬的调查单位构成所需的样本。

适⽤范围:主要适⽤于总体情况⽐较复杂,各类型或层次之间的差异较⼤,⽽总体单位⼜较多的情形,分层使层内各单位之间的差异减⼩,层间差异扩⼤。(⼀)类型⽐例抽样

按照总体单位数在各组之间的⽐例,分配各组的抽样单位数。即:各类型中抽取的样本单位数ni占该类型所有单位数Ni的⽐例是相等的,等同于样本单位总数n占总体单位数N的⽐例,即:

各类型组应抽取的样本单位数为:

样本⽐率抽样样本容量:按前⾯指定的⽐例(n/N)从每组的Ni单位中抽取ni个单位即构成⼀个抽样总体,其样本容量为:n= n1+ n2+ n3+…+ nk=(⼆)类型适宜抽样

在抽取样本单位数时,要考虑各类型组包含的单位数不同和标志变动度()的不同,变动程度()⼤的类型组要多抽样本单位数,变动程度()⼩的组要少多抽样本数,使得各类型组的变动程度()在所有类型组变动程度之和中的⽐例相等,等同于是或。

此外,还可将各类型组单位数和变动程度结合考虑,使得在所有类型组之和中所占⽐例等于或,即:

四、整群抽样

在全及总体中以群(或组)为单位,按纯随机⽅式或等距抽样⽅式,抽取若⼲群(或组),然后对所有抽中的各群(或各组)中的全部单位⼀⼀进⾏调查。五、多阶段抽样

将多个抽样程序分成若⼲阶段,然后逐阶段进⾏抽样,以完成整个抽样过程。

适⽤范围:总体包括的单位很多,⽽且分布很⼴,通过⼀次抽样抽选出样本是很困难的,这时使⽤多阶段抽样。多阶段抽样的⼀个例⼦

例:对我国的农产量进⾏抽样调查。

抽样⽅法是:先由省抽县,由抽中的县内再抽乡、村,由抽中的乡、村抽地块,最后才由抽中的地块再抽样本单位。怎么样随机分组

⼀.拟将12只⼤⿏随机分⼊甲、⼄两组,每组6名。1.应先把受试者按体重由⼩到⼤编号,

2.然后从随机数字表任意⼀处查出12个随机数,遇到相同的随机数则去掉(如从“随机数字表“第35⾏第1列向右查)。分配给每只⼤⿏3.并将随机数由⼩到⼤编秩(秩次R),

4.令R为1~6者分⼊甲组,R为7~12者分⼊⼄组。动物编号 1 2 3 4 5 6 7 8 9 10 11 12

随机数字 69 92 06 34 13 59 71 74 17 32 27 55秩次R 9 12 1 6 2 8 10 11 3 5 4 7 此为随机数字分组结果⼄⼄甲甲甲⼄⼄⼄甲甲甲⼄⼆.试验动物随机分6组,每组10只。完全随机化分组:

1,编号,将60个动物编号,可按体重⼤⼩编号

2,取随机数字:从随机数字表中任⼀⾏任⼀列开始,抄取60个随机数字,如遇相同数字,抄取下⼀个随机数.可以不按章法,横着抄,竖着抄,斜着抄数字都可以. 3,对随机数字按从⼩到⼤排序.4,分组:从排序后的数字中规定前10个为第⼀组.依次类推.区组随机化分组:

1,将动物的体重从轻到重编号,体重相近的6只配成⼀个区组2,从随机数字表中任⼀⾏任⼀列开始,抄取60个随机数字3,在每个区组内将随机数字按⼤⼩排序

4,将各组内序号为1的分为⼀组,序号为2的分为⼀组.依次类推.怎么样随机抽样1、随机的原则1)随机的意义

所谓随机,就是每⼀个受试对象都有同等的机会被分配到任何⼀个组中去,分组的结果不受⼈为因素的⼲扰和影响。实验设计中必须贯彻随机化原则,因为在实验过程中许多⾮处理因素在设计时研究者并不完全知道,必须采⽤随机化的办法抵消这些⼲扰因素的影响。

2)随机化的实施

实验设计中所指的总体不是泛指的⽆限总体,⽽是根据研究假设的要求规定的纳⼊标准,如动物的体重、年龄、病⼈的病情、经济条件、⽗母的⽂化程度等所选择的受试对象(即本次实验的有限总体),再把这些受试对象随机分⼊实验组和对照组中,以增强可⽐性,称为随机分配(randomized allocation)。随机化的实施就是如何进⾏随机分配。随机化的⽅法有多种,最简单的如抽签。但在实验设计中⼴泛应⽤随机数字表和随机排列表。(1)随机数字表和随机排列表

随机数字表表内数字相互独⽴,全部数字⽆论从横⾏、纵⾏或斜向等各种顺序均呈随机状态。因此,使⽤时可从任何⼀个数字开始,按任意⼀个顺序录⽤。

例如拟将12只⼤⿏随机分⼊甲、⼄两组,每组6名。1.应先把受试者按体重由⼩到⼤编号,

2.然后从随机数字表任意⼀处查出12个随机数,遇到相同的随机数则去掉(如从“随机数字表“第35⾏第1列向右查)。分配给每只⼤⿏3.并将随机数由⼩到⼤编秩(秩次R),

4.令R为1~6者分⼊甲组,R为7~12者分⼊⼄组。动物编号 1 2 3 4 5 6 7 8 9 10 11 12

随机数字 69 92 06 34 13 59 71 74 17 32 27 55秩次R 9 12 1 6 2 8 10 11 3 5 4 7 此为随机数字分组结果⼄⼄甲甲甲⼄⼄⼄甲甲甲⼄

随机排列表随机排列表⽐随机数字表更有实⽤性。它可以简便地将受试对象随机分配到实验所要求的各组中去,也可以对处理因素进⾏随机排列,但不适⽤于随机抽样研究。

本表共有n分别为10、20、30、40、50、100等不同⾃然数排列⽽成的六种随机排列表,本教材引⽤n为20的随机排列表。是每⾏或每列数字与顺序的等级相关系数,越⼩表⽰数字排列随机化程度越好。

例如,将10只⼩⿏随机分⼊甲、⼄两组。先将⼩⿏按体重由⼩到⼤编号,然后任意取n为20随机排列表中的任意⼀⾏或⼀列随机数,遇到⼤于或等于10的随机数则舍去。本例取随机排列表中第6⾏,令单号分⼊甲组,双号分⼊⼄组。动物编号:12345678910随机数字:2814309675

分组结果:⼄⼄甲⼄甲⼄甲⼄甲甲

所以,第3、5、7、9、10只⼩⿏被分⼊甲组,第1、2、4、6、8只⼩⿏被分⼊⼄组。(2)⼏种常⽤随机分组⽅法

⼤样本完全随机分组适⽤于每组例数⼤于100时的情况。⽅法是每个受试者给⼀个3位数的随机数,规定随机数区间:分两组(等概率)000~499 500~999

分三组(等概率)000~332 333~665 666~998

分四组(等概率)000~249 250~499 500~749 750~999

分五组(等概率)000~199 200~399 400~599 600~799 800~999

余类推,多余的随机数可忽略,如分三组时取000~998,分六组时取000~995之间的随机数。

在有些特殊情况下需进⾏不等概率分组时,可按⽐例调整随机区间。如按1:2分组,A组的随机数区间为000~333,B组为334~999;按1:3分组,A组为000~249,B 组为250~999。在临床试验中,不等概率分组的⽐例不能超过1:3。表13.1是1:2完全随机分组举例。表13.1 300例受试者1:2完全随机分组举例

受试者编号 1 2 3 4 5 6 7 8 9 10 11 (300)

随机数849 140 539 006 860 347 323 387 563 678 253 (961)处理 B A B A B B A B B B A … B

表13.2 等概率随机分组例数分布的抽样试验

备注:括号内为每组理想例数。

对于完全随机分组,各组例数没有必要调整到理想情况(如等概率分组两组例数相等)。表13.2的抽样试验结果还说明,当每组例数达到100例时,各组例数应该是⼤体相当的。万⼀出现⽐例严重失衡的情况,如200例等概率分组时,出现85:115或更不平衡的情况(出现概率⼩于0.05),需重新分组。表13.3 n个区组随机排列结果5 05 87 24 1 3 2 A C B

⽅法2当处理数k较⼩时(如k<5),由⽅法1得到的区组内处理的排序顺序可能出现重复,如表13.3中的区组3和4。此时,可⽤表13.4中全排列顺序确定各区组的排列⽅式。表13.4 k=3,4时区组内处理的全排列

例如,当k=3时,对5个区组内A,B,C三种处理进⾏随机排列。

取6个随机数:498,739,853,994,563,479,排序结果位2,4,5,6,3,1,查表13.4对应的序号,第⼀个区组的对应的序号是2,排列⽅式为ACB,第⼆个区组的对应的序号是4,排列⽅式为BCA,第三个区组的对应的序号是5,排列⽅式为CAB,第四个区组的对应的序号是6,排列⽅式为CBA,第五个区组的对应的序号是3,排列⽅式为BAC。

当k=2时(配对设计),因排列⽅法只有2种,即AB和BA,可⽤每个对⼦随机数的奇偶决定,但为了保证所有对⼦中这两种顺序出现机会均等,还可采⽤分段随机数分组的⽅法。

分段随机分组分段随机分组的基本思想是利⽤随机数⽣成若⼲数⽬相同的随机排列序列,再根据序列号进⾏分组,其⽬的是使分组结果达到预想的例数分配,既适⽤于⼩样本⼜适⽤于⼤样本。基本步骤是:①将分组过程分多个阶段进⾏,每个阶段只对m个试验材料随机分组。m必须是处理数的倍数,为了保证随机效果,m最好是处理数的5倍以上;②取m个3位随机数从⼩到⼤排序,得序号R;

③规定R所对应的处理,如20个动物等分为两组,则R:1~10为A组,R:11~20为B组。15名患者按1:2分为两组,则R:1~5为A组,R:6~15为B组。18名患者等分三组,R:1~6为A组,R:7~12为B组,R:13~18为C组。余类推。④将m个观察对象分配完毕以后,再按以上⽅法对下⼀批m个观察对象分组,直⾄分组结束。例如,将200名受试者随机等分为两组。

令m=10,需分20段完成全部分组。规定每段随机排列序号R对应处理,R:1~5为A组,R:6~10为B组,第1和第2阶段的分组结果见表13.5。表13.5分段随机分组举例受试者序号第1阶段分组结果1 2 3 4 5 6 7 8 9 10

随机数421 333 459 418 384 400 213 391 754 318 R 8 3 9 7 4 6 1 5 10 2 处理 B A B B A B A A B A受试者序号第2阶段分组结果1 2 3 4 5 6 7 8 9 10

随机数391 910 351 024 425 293 361 660 081 911R 6 9 4 1 7 3 5 8 2 10处理 B B A A B A A B A B

由表13.5第2阶段分组结果可看出,若采⽤随机数的奇偶数决定组别,则有7个奇数,3个偶数,不能达到每组例数相等的分组结果,但⽤随机数排列序号R 分组,可保证各组例数相等。配对设计时亦可采⽤此⽅法,如20个对⼦,预先规定R:1~10时处理排列顺序为AB,R:11~20时为BA。同理,当单位组个数n⼤于表5中的排列⽅式数时,亦可采⽤分段随机分组的⽅法,并规定m=k!,以最⼤限度地减少相同排列的重复次数。怎么样随机抽样

简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独⽴,彼此间⽆⼀定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较⼩和数⽬较少时,才采⽤这种⽅法。

适⽤于总体量⼤、差异程度较⼤的情况。先将总体单位按其差异程度或某⼀特征分类、分层,

然后在各类或每层中再随机抽取样本单位。分层抽样实际上是科学分组、或分类与随机原则的结合。分层抽样有等⽐抽样和不等⽐抽样之分,当总数各类差别过⼤时,可采⽤不等⽐抽样。除了分层或分类外,其组织⽅式与简单随机抽样和等距抽样相同。

随机抽样设计

⼀、纯随机抽样:对总体的所有容量不做任何的分类和排队,完全按随机原则逐个抽取样本容量。纯随机抽样的常⽤抽样⽅法

1)抽签法:将总体容量全部加以编号,并编成相应的号签,然后将号签充分混合后逐个抽取,直到抽到预定需要的样本容量为⽌。

缺点:总体容量很多时,编制号签的⼯作量很⼤,且很难掺和均匀。

2)随机数字法:⽤字母顺序或⾝份证号等任何⽅便的⽅法对总体容量编者按号,利⽤随机数表从1到总体容量N中随机抽取n(样本容量数)个数,遇到那些不在编号⾥的数字需跳过。

⼆、等距抽样:先将总体各单位按某⼀有关标志(或⽆关标志)排队,然后相等距离或相等间隔抽取样本单位。根据需要抽取的样本单位数(n)和全及总体单位数(N),可以计算出抽取各个样本单位之间的距离和间隔,即:K=N/n,然后按此间隔依次抽取必要的样本单位。等距抽样的⼀个例⼦

某企业有职⼯5000名,现要随机抽取100⼈进⾏家庭收⼊⽔平调查。

抽取⽅法:按与研究⽬的⽆直接关系的姓名笔划对总体进⾏排列,把总体划分为K=5000/100=50个相等的间隔,在第1⾄第50⼈中随机抽取⼀名,如抽到第10名,后⾯间隔依次抽取第60,110,160,210,…直到4960为⽌,总共抽取50同名职⼯组成⼀个抽样总体。

等距抽样的优点:(1)能保证被抽取到的样本单位在全及总体中均匀分布;(2)简化抽样过程。等距抽样应注意:要避免抽样间隔或样本距离和现象本⾝的节奏性或循环周期相重合。三、类型抽样

类型抽样:将全及总体中的所有单位按某⼀主要标志分组,然后在各组中采⽤纯随机抽样或等距抽样⽅式,抽取⼀定数⽬的调查单位构成所需的样本。

适⽤范围:主要适⽤于总体情况⽐较复杂,各类型或层次之间的差异较⼤,⽽总体单位⼜较多的情形,分层使层内各单位之间的差异减⼩,层间差异扩⼤。(⼀)类型⽐例抽样

按照总体单位数在各组之间的⽐例,分配各组的抽样单位数。即:各类型中抽取的样本单位数ni占该类型所有单位数Ni的⽐例是相等的,等同于样本单位总数n占总体单位数N的⽐例,即:各类型组应抽取的样本单位数为:

样本⽐率抽样样本容量:按前⾯指定的⽐例(n/N)从每组的Ni单位中抽取ni个单位即构成⼀个抽样总体,其样本容量为:n= n1+ n2+ n3+…+ nk=(⼆)类型适宜抽样

在抽取样本单位数时,要考虑各类型组包含的单位数不同和标志变动度()的不同,变动程度()⼤的类型组要多抽样本单位数,变动程度()⼩的组要少多抽样本数,使得各类型组的变动程度()在所有类型组变动程度之和中的⽐例相等,等同于是或。

此外,还可将各类型组单位数和变动程度结合考虑,使得在所有类型组之和中所占⽐例等于或,即:四、整群抽样

在全及总体中以群(或组)为单位,按纯随机⽅式或等距抽样⽅式,抽取若⼲群(或组),然后对所有抽中的各群(或各组)中的全部单位⼀⼀进⾏调查。五、多阶段抽样

将多个抽样程序分成若⼲阶段,然后逐阶段进⾏抽样,以完成整个抽样过程。

适⽤范围:总体包括的单位很多,⽽且分布很⼴,通过⼀次抽样抽选出样本是很困难的,这时使⽤多阶段抽样。多阶段抽样的⼀个例⼦

例:对我国的农产量进⾏抽样调查。

抽样⽅法是:先由省抽县,由抽中的县内再抽乡、村,由抽中的乡、村抽地块,最后才由抽中的地块再抽样本单位。

因篇幅问题不能全部显示,请点此查看更多更全内容

Top