- 480.50 KB
- 19页
- 1、本文档共5页,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 文档侵权举报电话:19940600175。
'第三节实验设计的基本原则 在实验设计中,应当严格遵守对照、随机、重复和均衡四个基本原则。1、对照的原则1)设立对照的意义设立对照组的的意义在于使实验组和对照组内的非处理因素的基本一致,即均衡可比。对照的意义还可以用以下符号表达:实验效应是与混在一起的,实验设计的主要任务是如何使能单独显示出来。设立对照,使实验中两组(或多组)的均衡,即。这样,实验组的效应就可以显示出来。:处理因素;与:相同的非处理因素;:与之差;:实验效应,与是与的影响结果;:与之差的效应。这样,通过对照就消除了非处理因素对实验效应的影响。2)对照的基本形式对照的形式有多种,可根据研究目的和内容加以选择,常用的有下列几种。(1)空白对照对照组不施加任何处理因素。例如,观察某种疫苗预防肾综合征出血热的效果,选择人口数量和构成、发病水平、地理环境、主要宿主鼠类基本相似的两个疫区,一个作为试验区,在人群中接种疫苗,另一个作为对照区,不施加任何干预措施,处理因素完全空白。这种对照只有在处理因素很强,非处理因素很弱的情况下才能使用。在临床试验中,一般不用空白对照。
(2)实验对照对照组不施加处理因素,但施加某种实验因素。如观察赖氨酸对儿童发育的影响,实验组儿童课间加食含赖氨酸的面包,对照组儿童课间加食不含赖氨酸的面包。处理因素是赖氨酸,非处理因素的面包量两组是相同的。(3)标准对照不设立专门的对照组,而是用现有标准值或正常值做对照。在临床试验中常以某疗法为标准对照组,这种对照应注意标准组必须是代表当时水平的疗法,切不可用降低标准组的方法使实验效应提高。但实验研究一般不用标准对照,因为实验条件不一致,常常影响对比效果。(4)自身对照对照与实验在同一受试者身上进行,如用药前后作为对比。一般情况下还要求设立平行对照组。(5)相互对照这种对照不设立对照组,而是两个或几个试验组相互对照。例如用莫雷西嗪治疗冠心病、高血压、心肌病和失调症引起的室性早搏时,设立冠心病组、高血压组、心肌病组和失调症组四个治疗组,相互比较它们的疗效。(6)配对对照把研究对象条件相同的两个配成一对,分别给以不同的处理因素,对比两者之间的不同效应。配对对照常用于动物实验,临床试验也可采用,但严格地说,很难找到相同或十分相似的对子。(7)历史对照以本人过去的研究或他人研究结果与本次研究结果做对照。除了非处理因素影响较小的少数疾病外,一般不宜使用这种对照。用时要特别注意资料的可比性。2、随机的原则1)随机的意义所谓随机,就是每一个受试对象都有同等的机会被分配到任何一个组中去,分组的结果不受人为因素的干扰和影响。实验设计中必须贯彻随机化原则,因为在实验过程中许多非处理因素在设计时研究者并不完全知道,必须采用随机化的办法抵消这些干扰因素的影响。2)随机化的实施实验设计中所指的总体不是泛指的无限总体,而是根据研究假设的要求规定的纳入标准,如动物的体重、年龄、病人的病情、经济条件、父母的文化程度等所选择的受试对象(即本次实验的有限总体),再把这些受试对象随机分入实验组和对照组中,以增强可比性,称为随机分配(randomizedallocation)。随机化的实施就是如何进行随机分配。随机化的方法有多种,最简单的如抽签。但在实验设计中广泛应用随机数字表和随机排列表。(1)随机数字表和随机排列表
随机数字表表内数字相互独立,全部数字无论从横行、纵行或斜向等各种顺序均呈随机状态。因此,使用时可从任何一个数字开始,按任意一个顺序录用。例如,拟将12只大鼠随机分入甲、乙两组,每组6名。应先把受试者按体重由小到大编号,然后从随机数字表任意一处查出12个随机数,遇到相同的随机数则去掉(如从“随机数字表“第35行第1列向右查)。并将随机数由小到大编秩(秩次R),令R为1~6者分入甲组,R为7~12者分入乙组。动物编号123456789101112随机数字699206341359717417322755秩次R912162810113547分组结果乙乙甲甲甲乙乙乙甲甲甲乙随机排列表随机排列表比随机数字表更有实用性。它可以简便地将受试对象随机分配到实验所要求的各组中去,也可以对处理因素进行随机排列,但不适用于随机抽样研究。本表共有n分别为10、20、30、40、50、100等不同自然数排列而成的六种随机排列表,本教材引用n为20的随机排列表。是每行或每列数字与顺序的等级相关系数,越小表示数字排列随机化程度越好。例如,将10只小鼠随机分入甲、乙两组。先将小鼠按体重由小到大编号,然后任意取n为20随机排列表中的任意一行或一列随机数,遇到大于或等于10的随机数则舍去。本例取随机排列表中第6行,令单号分入甲组,双号分入乙组。动物编号:12345678910随机数字:2814309675分组结果:乙乙甲乙甲乙甲乙甲甲所以,第3、5、7、9、10只小鼠被分入甲组,第1、2、4、6、8只小鼠被分入乙组。(2)几种常用随机分组方法大样本完全随机分组适用于每组例数大于100时的情况。方法是每个受试者给一个3位数的随机数,规定随机数区间:分两组(等概率)000~499500~999分三组(等概率)000~332333~665666~998
分四组(等概率)000~249250~499500~749750~999分五组(等概率)000~199200~399400~599600~799800~999余类推,多余的随机数可忽略,如分三组时取000~998,分六组时取000~995之间的随机数。在有些特殊情况下需进行不等概率分组时,可按比例调整随机区间。如按1:2分组,A组的随机数区间为000~333,B组为334~999;按1:3分组,A组为000~249,B组为250~999。在临床试验中,不等概率分组的比例不能超过1:3。表13.1是1:2完全随机分组举例。表13.1300例受试者1:2完全随机分组举例受试者编号1234567891011…300随机数849140539006860347323387563678253…961处理BABABBABBBA…B表13.2等概率随机分组例数分布的抽样试验随机数区间总例数100200300400600800100015002000000~09911233036587793144191100~1996172938546890137180200~299142535477092113172226300~39992030425987106157216400~499102339507292118165218500~599122334436990112146193600~69910182834527995149203700~7999172839627999147189800~8996121731456683138193900~99913223040597091145191
最小例数分2组5092137187287384480725969(50)(100)(150)(200)(300)(400)(500)(750)(1000)分5组17344771104136174281371(20)(40)(60)(80)(120)(160)(200)(300)(400)备注:括号内为每组理想例数。对于完全随机分组,各组例数没有必要调整到理想情况(如等概率分组两组例数相等)。表13.2的抽样试验结果还说明,当每组例数达到100例时,各组例数应该是大体相当的。万一出现比例严重失衡的情况,如200例等概率分组时,出现85:115或更不平衡的情况(出现概率小于0.05),需重新分组。随机数区间总例数100200300400600800100015002000000~09911233036587793144191100~1996172938546890137180200~299142535477092113172226300~39992030425987106157216400~499102339507292118165218500~599122334436990112146193600~69910182834527995149203700~7999172839627999147189800~8996121731456683138193900~99913223040597091145191最小例数分2组5092137187287384480725969(50)(100)(150)(200)(300)(400)(500)(750)(1000)17344771104136174281371
分5组(20)(40)(60)(80)(120)(160)(200)(300)(400)备注:括号内为每组理想例数。对于完全随机分组,各组例数没有必要调整到理想情况(如等概率分组两组例数相等)。表13.2的抽样试验结果还说明,当每组例数达到100例时,各组例数应该是大体相当的。万一出现比例严重失衡的情况,如200例等概率分组时,出现85:115或更不平衡的情况(出现概率小于0.05),需重新分组。表13.3n个区组随机排列结果区组(入院时间)随机数随机数序号随机排列结果患者1患者2患者3患者1患者2患者3患者1患者2患者31690175213BAC2186581123ABC3852250312CAB4885076312CAB5058724132ACB6906416321CBA方法2当处理数k较小时(如k<5),由方法1得到的区组内处理的排序顺序可能出现重复,如表13.3中的区组3和4。此时,可用表13.4中全排列顺序确定各区组的排列方式。表13.4k=3,4时区组内处理的全排列K=31ABC2ACB3BAC4BCA5CAB6CBAK=41ABCD2ABDC3ACBD4ACDB5ADBC6ADCB7BACD8BADC9BCAD10BCDA11BDAC12BDCA13CABD14CADB15CBAD16CBDA17CDAB18CDBA19DABC20DACB21DBAC22DBCA23DCAB24DCBA例如,当k=3时,对5个区组内A,B,C三种处理进行随机排列。取6个随机数:498,739,853,994,563,479,排序结果位2,4,5,6,3,1,查表13.4对应的序号,第一个区组的对应的序号是2,排列方式为ACB,第二个区组的对应的序号是4,排列方式为BCA,第三个区组的对应的序号是5,排列方式为CAB,第四个区组的对应的序号是6,排列方式为CBA,第五个区组的对应的序号是3,排列方式为BAC。
当k=2时(配对设计),因排列方法只有2种,即AB和BA,可用每个对子随机数的奇偶决定,但为了保证所有对子中这两种顺序出现机会均等,还可采用分段随机数分组的方法。分段随机分组分段随机分组的基本思想是利用随机数生成若干数目相同的随机排列序列,再根据序列号进行分组,其目的是使分组结果达到预想的例数分配,既适用于小样本又适用于大样本。基本步骤是:①将分组过程分多个阶段进行,每个阶段只对m个试验材料随机分组。m必须是处理数的倍数,为了保证随机效果,m最好是处理数的5倍以上;②取m个3位随机数从小到大排序,得序号R;③规定R所对应的处理,如20个动物等分为两组,则R:1~10为A组,R:11~20为B组。15名患者按1:2分为两组,则R:1~5为A组,R:6~15为B组。18名患者等分三组,R:1~6为A组,R:7~12为B组,R:13~18为C组。余类推。④将m个观察对象分配完毕以后,再按以上方法对下一批m个观察对象分组,直至分组结束。例如,将200名受试者随机等分为两组。令m=10,需分20段完成全部分组。规定每段随机排列序号R对应处理,R:1~5为A组,R:6~10为B组,第1和第2阶段的分组结果见表13.5。表13.5分段随机分组举例受试者序号第1阶段分组结果12345678910随机数421333459418384400213391754318R83974615102处理BABBABAABA受试者序号第2阶段分组结果12345678910随机数391910351024425293361660081911R69417358210处理BBAABAABAB由表13.5第2阶段分组结果可看出,若采用随机数的奇偶数决定组别,则有7个奇数,3个偶数,不能达到每组例数相等的分组结果,但用随机数排列序号R分组,可保证各组例数相等。配对设计时亦可采用此方法,如20个对子,预先规定R:1~10时处理排列顺序为AB,R:11~20时为BA。同理,当单位组个数n大于表5中的排列方式数时,亦可采用分段随机分组的方法,并规定m=k!,以最大限度地减少相同排列的重复次数。3、重复原则所谓重复,就是实验要有足够的样本含量。重复是消除非处理因素影响的又一重要手段。
1)影响样本含量大小的因素实验所需的样本含量取决于以下4个因素:(1)假设检验的第Ⅰ类错误的概率(检验水准)取值越小,实验所需的样本含量越大。(2)假设检验的第Ⅱ类错误的概率(检验水准)取值越小,实验所需的样本含量越大。另外,如果把第Ⅱ类错误的概率定为,那么就是假设检验的检验效能(power),即处理组间实际上有差别,且假设检验结果能发现该差别的概率,通常检验效能取值为0.80,0.90,0.95或0.99。检验效能越大,实验所需的样本含量越大。(3)处理组间的差别处理组间的差别越小,实验所需的样本含量越大。(4)实验单位的标准差实验单位的标准差越大,实验所需的样本含量越大。2)确定样本含量时应当具备的条件(1)建立检验假设。(2)定出检验水准和检验效能首先确定本次实验中允许犯第Ⅰ类错误的概率,通常取;同时还应明确是单侧或双侧检验。然后,在特定的检验水准条件下(比如),确定检验效能,通常定为0.80,根据需要有时可以定为0.90或0.75。但是,在科研设计时检验效能不宜低于0.75,否则检验的结果很可能反映不出总体的真实差异,出现非真实的阴性结果。确定检验水准和检验效能,实际上是如何确定假设检验时犯第Ⅰ类错误的概率和第Ⅱ类错误的概率,和的大小应根据第Ⅰ类错误和第Ⅱ类错误的危害性来决定。以新药疗效论证的临床试验为例,第Ⅰ类错误是将疗效与对照药本无差别的新药看作对照药的替代品,第Ⅱ类错误是将疗效优于对照药的新药看作与对照药的疗效相同。如果新药的生产成本低于对照药且副作用比对照药小,不妨将和定得小一些,如,。反之,若新药的生产成本高于对照药或副作用比对照药大,应将定的略小一些,定得大一些,如,
。检验效能就是优秀药物经过实验被发现的概率。当研究者倾向接受时,应取较大的值,如0.95,0.99。(3)确定所比较的总体参数间的差值和总体标准差例如,比较两总体均数或总体率的差异时,应当知道总体间的差值的信息。如两总体均数间的差值的信息。两总体率间的差值的信息。有时研究者很难得到总体参数的信息,可以用专业上(临床上)认为有意义的差值代替,如平均舒张压的差值0.69kPa(5mmHg)等。当然,也可以根据试验的目的认为规定,如规定实验的新药有效率超过标准药物有效率的30%才有推广意义等。此外,确定两均数比较的样本含量还需要估计总体标准差的信息。还可以通过预试验,获得样本间的差值和样本标准差做为总体参数间的差值和总体标准差的估计值进行样本含量的估计。3)确定样本含量的用途(1)估算达到有统计学意义的最低样本含量例如,根据文献报道血吸虫病人血红蛋白平均含量为90g/L,标准差为25g/L,现欲观察呋喃丙胺治疗后能否使血红蛋白增加。规定治疗后血红蛋白至少增加10g/L以上为有效,(双侧),,问应治疗多少病人?回答这一问题可用下面的公式进行估算:=10g/L,=25g/L,,单侧例。(2)估计检验效能对于现有的实验结果,已知样本含量,可以根据总体的差值估计实验的检验效能是否够大。例如,在查阅文献和借鉴前人经验时,若其假设检验的结果为
,则做出无统计学意义的“阴性”结论时,研究者则面临着犯第Ⅱ类错误的可能性,应当考虑是否总体间的差异确实存在,有可能由于检验效能不足而未能把总体中确有的差异反映出来。目前,许多国际会议对于假设检验中做出的“阴性”结论,应附有犯第Ⅱ类错误的概率为据,因而有必要介绍估计检验效能的方法。例如,两样本均数比较的资料,当两样本例数相等时可用下式计算其检验效能:式中为两组合计例数。(3)估计总体参数的差异()根据已知条件初步确定样本含量,并规定期望的检验效能为0.90,估计总体参数的差值,例如,两样本均数比较4)常用的估计样本含量的方法当研究者确定和,并对和做出估计后,就可以根据设计类型和要求估计样本含量。(1)样本均数与总体均数的比较确定和后,令,为实验结果的总体标准差,样本含量的计算公式为:(13.1)其中,为实验所需的样本含量,有单双侧之分,只取单侧,和为相应的正态分位数。例13.1据文献报道,脑血栓形成后血浆纤维蛋白浓度的均数和标准差分别为4.3(g/L)和1(g/L)。现试验一治疗措施,期望试验结果至少使血浆纤维蛋白浓度平均下降1(g/L),问至少需要观察多少病例?
解:用公式13.1计算,取,,又知,。由标准正态分布表查出单侧界值,单侧,代入公式,因此,该治疗方案至少需要治疗16例病人作为样本。(2)配对设计和交叉试验的样本含量估计配对试验和交叉试验估计样本例数的公式为:(13.2)式中,为实验所需的对子数目,是每对观察对象差值的标准差,为期望能达到的最小差值,有单双侧之分,只取单侧,和为相应的正态分位数。例13.2研究碳酸铝对白细胞减少症的治疗效果,期望治疗后比治疗前平均增加/L,已知标准差为,规定(双侧检验),,求样本含量.解:用公式13.2计算,由标准正态分布表查出双侧界值,单侧,代入公式,可取15个患者参加试验。(3)两样本均数比较两样本均数比较的完全随机设计分两组例数相等和两组例数不等两种情形,但当两组例数相等时检验效能最高,设计时应尽量使两组例数相等,对于两组例数不等的情形,应使两组例数相近。这里仅介绍两组例数相等时的样本含量估算方法。公式为:
(13.3)式中,为每组所需的样本例数,其它符号的意义同公式(13.1)。例13.3用新药降低高血脂患者的胆固醇,研究者规定试验组与对照组(安慰剂)相比,血清胆固醇平均降低0.5mmol/L以上才有推广价值。引用文献中胆固醇的标准差为0.8mmol/L,规定(单侧检验),,求每组所需例数。解:用公式13.3计算,取,,又知,。由标准正态分布表查出单侧界值,单侧,代入公式,所以,每组需要44例。(4)样本率与总体率的比较确定和后,为历史对照的总体率,为实验结果的总体率,,令,为实验结果的总体标准差,样本含量的计算公式为:(13.4)式中,为所需的样本含量,有单双侧之分,只取单侧,和为相应的正态分位数。例13.4已知常规治疗某病的有效率为80%,现试验一种新疗法,预计有效率为90%,规定(单侧检验),,求所需例数。
解:,,,单侧界值,单侧,代入公式(13.4)所需样本例数为137例。(5)两样本率的比较两样本均数比较的完全随机设计有两组例数相等和两组例数不等两种情形,但当两组例数相等时检验效能最高,设计时应尽量使两组例数相等,对于两组例数不等的情形,应使两组例数相近。这里仅介绍两组例数相等时的样本含量估算方法。公式为:(13.5)式中,为两组总例数,每组的例数为,和分别代表两组的总体率,表示两组的合并率。有单双侧之分,只取单侧,和为相应的正态分位数。例13.5用旧药治疗慢性肾炎的近控率为30%,现实验新药的疗效,要求新药的近控率达到50%才能推广应用使用,二者合并率为40%,(单侧),,问每组需要多少病例?解:已知,,,单侧界值,单侧,代入公式(13.5)所以,每组各取103例参加试验。
(6)配对计数资料配对计数资料的整理格式如表13.6,一般用检验进行处理。其样本含量的估算见公式(13.6)。表13.6A、B两种检验方法比较A法B法合计+-+aba+b-cdc+d合计a+cb+da+b+c+d(13.6)式中,为实验所需的对子数,,,,有单双侧之分,只取单侧,和为相应的正态分位数。例13.6已知某菌种接种于甲、乙两种培养基的结果如下:甲培养基阳性、乙培养基阴性的,甲培养基阴性、乙培养基阳性的,(双侧检验),,现准备研究一种新的与该菌种相似的菌种,问需观察多少样本对子数?解:,,,双侧界值,单侧,代入公式(13.6)
所以,该实验至少应取57对样品。(7)多个样本均数比较多个样本均数比较的设计类型有多种,这里仅介绍各组例数相等的完全随机设计和随机区组设计的多个样本均数比较的样本含量估算方法。公式为:(13.7)式中为各组样本所需例数,和分别为第个样本的均数和标准差的初估值,,为组数。值由值表查得。先以和,,,查得代入公式(13.7)求得,第二次由,查得,代入公式(13.7)中求,访此进行,直至前后两次求得结果趋于稳定为止,即为所求的样本例数。以上为完全随机设计时的值求法,当为随机区组设计时,第一次,公式(13.7)中的用误差均方代替。例13.7某医院为研究三种药物的退药效果,经预试验得到药物退热时间(天)的分别为,,。给定,,问正式试验各组需观察多少病例?解:,,,,,,,,,则
以,,查值表,,代入公式(13.7)计算,查值表得,再代入公式(13.7)计算,查值表得,再代入公式(13.7)计算这时,,所以,正式试验时每组至少需观察19例病人。(8)多个样本率比较多个样本率比较的设计类型有多种,这里仅介绍各组例数相等的完全随机设计的多个样本率比较的样本含量估算方法。公式为:(13.8)式中为每个样本所需观察例数,和分别为最大率和最小率,当仅知最大率和最小率差值时,则取,,是给定、和自由度,由值表查得,为组数。公式中平面角的单位是弧度。
例13.8某研究者拟观察A、B、C三种治疗方法治疗某病的治疗效果,预试验结果为:A法有效率54.8%,B法有效率28.46%,C法有效率14.9%,问正式试验各组需观察多少例病人?解:,,以,,,查值表得,代入公式(13.8)中所以每组各需33例病人参入试验。(9)估计总体均数确定后,令为期望估计误差的最小值,为总体标准差,样本含量的计算公式为:(13.9)式中为所需的样本含量,有单、双侧之分,为相应的正态分位数。例13.9某研究者拟用单纯抽样方法了解某地区成年男子血红蛋白的平均水平,希望误差不超过2g/L,根据文献,血红蛋白的标准差约为25g/L,如(双侧),问需调查多少病人?解:代入公式(8.9)所以,需调查600人。(10)估计总体率确定后,令为期望估计误差的最小值,为总体率的标准差,样本含量的计算公式为:(13.10)
式中为所需的样本含量,有单、双侧之分,为相应的正态分位数。例13.10据以往调查结果,高血压的患病率为8%,某研究者欲了解某地高血压的患患病率,希望误差不超过2%,问需调查多少人?解:取(双侧),,,,代入公式(13.10)得所以,需要调查707人。(11)直线相关分析的样本含量如果实验设计的目的是观察变量之间的相关关系,则需要用如下公式估算用于相关分析的样本含量。(13.11)式中,为相关分析的样本例数,为估计的总体相关系数,有单双侧之分,只取单侧,和为相应的正态分位数。例13.11研究健康儿童发硒(X,1000ppm)与血硒(Y,1000ppm)的相关关系,根据参考文献报道,总体相关系数,问需要抽取多少名儿童作相关分析?解:已知,规定(双侧检验),,双侧界值,单侧,代入公式(13.11)所以,需要抽取9名儿童作相关分析。
有关两相关系数的比较,生存率分析等的样本含量估算方法参见有关书籍。4、均衡原则1)均衡的意义所谓均衡,就是要设法使各条件(即实验因素的各水平组合)下的受试对象受到非处理因素的干扰和影响的机会和数量基本相等。这样以来,由各组受试对象反映出来的实验效应才能较为客观地体现出处理因素因素取不同水平时所产生的效果。2)均衡对照的实施对照的一个极其重要的前提是对照必须是均衡的。贯彻均衡的原则就是对照组除了缺少一个处理因素外,其它条件应与实验组均衡一致。这就是上述对照原则中表述的的原则。均衡性越好,就越能显示出试验组处理因素所产生的效应,从而可以减少非处理因素对实验结果的影响。在实验(或试验)设计中,没有对照就无法比较鉴别,有了对照没有遵循均衡原则也同样得不到正确的结论。例如,有人在研究耐力训练与提高战士体质的关系时,设计了如下实验:以血乳酸为主要观察指标,用20名连队的战士按训练方案进行耐力训练,以机关同龄的20名战士为对照,对照组进行日常活动,观察经4周训练后,两组战士进行一定的运动时血乳酸的变化,结果如表13.7:表13.7:两组战士训练前后血乳酸(mg/L)的观察结果组别训练前训练后训练组38.2±3.533.1±3.1**##对照组40.0±4.038.9±3.5**与训练前比P<0.01##与对照组比P<0.01因而,所给出的耐力训练提高了战士的耐力的结论毫无意义。因人们早就认识到了训练和不训练不一样。应研究不同训练方案对提高战士体质之间的差别有无显著性意义,以探索最大限度地提高战士体质的最佳方案。另外,分组时,连队战士和机关战士都应随机抽取,然后将各自的样本含量的一半随机分入试验组和对照组。该设计和结论,从逻辑上讲是合理的,然而仔细考虑后就会发现有严重的缺陷。主要问题是对照选择不合理,使训练组和对照组的非处理因素不均衡。本试验中,对照组除训练因素外,其他应尽可能与试验组一致,而机关战士和连队的战士由于工作性质不同,体能的基础可能存在较大的差别,一开始两组之间就不具备均衡原则。'