logo资料库

成组序贯方法的模拟比较研究.pdf

第1页 / 共9页
第2页 / 共9页
第3页 / 共9页
第4页 / 共9页
第5页 / 共9页
第6页 / 共9页
第7页 / 共9页
第8页 / 共9页
资料共9页,剩余部分请下载后查看
中国科技论文在线 http://www.paper.edu.cn 成组序贯方法的模拟比较研究# 刘伟杰,谭旭辉** (南方医科大学公共卫生学院生物统计系,广东广州 510515) 摘要:目的:比较 O’Brien & Fleming 法(OBF 法)、Pocock 法以及指数族损耗函数法的 优劣。方法:以试验组和对照组的两样本均数比较的统计优效性检验为分析目的,在不同设 计样本量的条件下,计算 I 类错误、检验功效 Power、平均样本量、平均阶段数以及早期拒 绝率等各项指标。结果:在大样本的情况下,OBF 法、Pocock 法以及损耗函数法均能将 I 类错误控制在 0.05 左右,其功效均能保持在 0.9 左右;在大样本的情况下,Pocock 法与ρ =1 的损耗函数法的早期拒绝率相近,OBF 法与ρ =3 的损耗函数法的早期拒绝率相近;在小 样本的情况下,损耗函数法的 I 类错误和功效分别能保持在 0.05 和 0.9 左右;在设计阶段 数为 5、4 和 3 的条件下,ρ =1 时的早期拒绝率均高于ρ =3 时的早期拒绝率。结论:在大样 本情况下,Pocock 法与ρ =1 的损耗函数法的效果相近,OBF 法与ρ =3 的损耗函数法的效果 相近。在小样本情况下,损耗函数法可一定程度避免由于提前达到最大信息量而异常终止的 情况。损耗函数法在小样本的期中分析中有较高的应用价值。 关键词:成组序贯设计;损耗函数法;信息量 中图分类号:R195.1 5 10 15 20 Simulation and Comparison Study of Group Sequential 25 30 35 40 45 Methods LIU Weijie, TAN Xuhui (Department of Biostatistics,School of Public Health,Southern Medical University,GuangZhou,GuangDong 510515) Abstrac t:Objective :Tocompare the advantages and disadvantages betweenO’Brien&Fle ming(OBF method), Pocock and error spending methods with parameter ρ.Methods: Aiming at the statistical superiority hypothesis test of two independent samples between control and t reat ment, the type I e rror, power, average samp le nu mber, average stage and early re jection p robabilitywerecalcu latedunder the condition ofdifferent sa mple sizes.Results: In the case of la rge sample sizes, type I error based on OBF, Pocock and error spending methods were controlledataround 0.05, and their powerscould be ma intained at around 0.9.In the case of large samples, the early rejection probability of Pocock was similar to that of e rror spending methods with ρ =1 , whilethe early re jection probability ofOBFwassimila r to that of error spending methods with ρ =3. Under the condition of small sa mples, the type I error and power of the error spending methodscould be controlled at around 0.05 and 0.9 respectively.Under the condition ofdifferent stages of the design, the early rejection probability ofe rror spending methods with ρ =1 was higher th an that of ρ=3.Conclusion:Under the condition of la rge sample sizes, the effect of Pocock is similar to that of error spending methods with ρ =1,wh ile effect of OBF is simila r to that of e rror spending methods with ρ =3.In the case of small sa mples, error spending methods avoidabnormal termination that is due toreaching the ma ximu m informationin advance.The error spending methods have a higher application value in the interim analysis with sma ll sa mple sizes. Ke ywor ds: group sequential design; error spending methods ; information leve l 基金项目:国家自然科学基金资助项目(81302515);高等学校博士学科点专项科研基金新教师类资助课 题(20134433120023);广东省自然科学基金(S2013040013902) 作者简介:刘伟杰(1994-),男,硕士研究生,主要研究方向:临床试验统计方法 通信联系人:谭旭辉(1978-),男,副教授,主要研究方向:贝叶斯统计,临床试验研究方法. E-mail: txhlove@163.com - 1 -
中国科技论文在线 http://www.paper.edu.cn 0 引言 国内现阶段的临床试验设计中,多数以固定样本量设计为主,这类设计需全部样本被纳 入试验后才可进行假设检验。为了尽早确认试验的有效性,以及监测试验的安全性,成组序 50 贯设计为此提供了多次期中分析的机会。然而在实际应用中,两种经典成组序贯设计的期中 分析方法(O’Br ien & Fleming 法和 Pocock 法)[1-2]在小样本的情况下会出现信息量的异常, 从而导致成组序贯期中分析的异常终止。故本文在详细阐述各种期中分析方法的基础上,利 用统计模拟对 O’Br ien & Fleming 法(下称 OBF 法)、Pocock 法以及损耗函数法(Error Spending 法)[3]进行比较,计算各方法在不同情况下的 I 类错误,Power、平均样本量以及平均阶段 数,探讨在小样本情况下损耗函数法能否有效地解决期中分析异常终止的问题,从而为小样 55 本情况下的成组序贯分析提供理论参考。 1 方法与原理 1.1 固定边界值法 固定边界值法是经典成组序贯分析方法之一,其主要包括 OBF 法和 Pocock 法等。这类 方法须事先确定期中分析次数且假定各阶段所需信息量均匀分布。而从临界值的计算过程来 60 看,Pocock 法实际上就是各阶段采用相等的临界值 ,OBF 法则是采用公式 (k=1,2,…,K)计算各阶段的临界值;其中临界值 是由公式(1) 在保证总的Ⅰ类错误控制在前提下通过迭代数值积分计算得到。 (1) 1.2 损耗函数法 65 与固定边界值法不同,损耗函数法通过构造一个连续的损耗函数 计算各阶段的检 验临界值和名义检验水准,利用损耗函数的不同形式来反映总的Ⅰ类错误的消耗过程[3]。其 中 一般表示为期中分析时该阶段所消耗的信息量占试验最大信息量的比值,如 表示第 k 次期中分析观察到的信息量, 表示试验最大信息量,则第 k 次分析时的信息比 。 70 每次期中分析时,将该阶段信息比 代入损耗函数即可计算出该阶段所消耗的Ⅰ类错 误 。在成组序贯设计中,损耗函数需满足以下条件: 单调递增且 , ;每阶段的Ⅰ类错误记为 ,则有 75 耗函数形式有以下四种[4]: (2)常用的损 (3) - 2 - PockCCKkCCOBFk//kC}},,,{}{{2211110KKCZCZCZCZP)(EkImaxImax/IIkkkk)(E0)0(E)1(Ek)/(max11IIE,3,2),/()/(max1maxkIIEIIEkkk}),(22min{)(2/uE
中国科技论文在线 http://www.paper.edu.cn (4) (5) (6) 80 其中,为试验事先指定的总 I 类错误概率。在确定损耗函数形式后,期中分析不同阶 段的边界值可通过对公式(7)进行迭代数值积分得到[5],从而使Ⅰ类错误维持在。 损耗函数公式(3)和(4)所构造的临界值分别与 Pocock 法和 OBF 法相似[6];公式(5) 中含有参数 γ,称为伽玛族损耗函数[7];公式(6)含有参数 ρ,称为指数族损耗函数[8]。 (7) 85 2 模拟研究 本文选取 OBF 法,Pocock 法以及指数族损耗函数法进行两样本均数比较的模拟研究。 采用 SAS9.4 随机模拟产生每个阶段的试验数据。在期中分析中,通过计算各种成组序贯设 计方法下的 I 类错误、检验功效 Power、平均样本量(Average Sample Number,ASN),平 均终止阶段数(Average Stage,AS)以及早期拒绝率(EarlyRejectionProbability,ERP)等 指标,综合评价各种期中分析方法的优劣。其中早期拒绝率为备择假设条件下期中分析在前 K-1 个阶段拒绝原假设的概率。较大的早期拒绝率意味着成组序贯试验实际所需样本量低于 同参数条件下的固定样本量的概率越大。 在模拟过程中,以统计优效性假设检验 , ,单侧 =0.05,=0.1(即 Power=0.9),阶段数 K=3,4,5 为设计框架;效应差别 ,共同 标准差=12,试验组均值 MT=12 或 15,对照组均值 MC=12;模拟次数为 1000 次。具体参 数设置如表 1 所示。 表 1 大样本模拟参数设定 Tab. 1 Parameterssetting of simulationunder the condition of large sample sizes 90 95 100 方法类别 设计方法 研究假设 模拟次数   阶段数 M T M C 固定边界值法 Pocock 阴性假设 1000 0.05 0.1 阳性假设 1000 0.05 0.1 阴性假设 1000 0.05 0.1 OBF 阳性假设 1000 0.05 0.1 - 3 - 3 4 5 3 4 5 3 4 5 3 4 5 12 12 15 12 12 12 15 12 A 3 3 3 3  12 12 12 12 }],)1(1log[min{)(eE}),1/()1(min{)(eeE},min{)(EKkCZCZPCZPkkk,2,}0|,{}0|{111110:0H)3(0>:1AH3A
中国科技论文在线 指数族损耗函数法 =1 =3 阴性假设 1000 0.05 0.1 阳性假设 1000 0.05 0.1 阴性假设 1000 0.05 0.1 阳性假设 1000 0.05 0.1 http://www.paper.edu.cn 12 12 15 12 12 12 15 12 3 3 3 3 12 12 12 12 3 4 5 3 4 5 3 4 5 3 4 5 由于表 1 所示的模拟均是大样本(每阶段每组样本量均在 50 以上)的模拟,这使得实 际信息量的累积过程是均匀递增的。但在小样本条件下,由于每个阶段所纳入的样本量较少, 每阶段实际信息量可能会严重偏离理论信息量,甚至出现实际信息量提前达到最大信息量的 现象,从而导致 OBF 法和 Pocock 法的期中分析异常终止[9]。针对该情况,可利用损耗函数 法判断每阶段是否达到最大信息量,并以此来决定试验是否提前终止。为进一步研究在小样 本情况下指数族损耗函数法的实际效果,以表 2 所示参数进行小样本(每阶段每组样本量均 在 15 以上)模拟。 Tab. 2 Parameters setting of simulation under the condition of small sample sizes 表 2 小样本模拟参数设定 105 110 方法类别 设计方法 研究假设 模拟次数   阶段数 M T M C A 指数族损耗函数法 =1 =3 阴性假设 1000 0.05 0.1 阳性假设 1000 0.05 0.1 阴性假设 1000 0.05 0.1 阳性假设 1000 0.05 0.1 3 结果 3.1 大样本情况下两总体均值相同 3 4 5 4 5 3 4 3 4 5 12 12 3 15 12 3 12 12 3 15 12 3  6 6 6 6 在两总体均数相同条件下,按照表 1 的参数设置,大样本情况下成组序贯设计各方法的 115 I 类错误如表 3。从表 3 的阴性研究模拟结果中可以看出,各种成组序贯设计方法的 I 类错 误均能稳定保持在 0.05 左右。 - 4 -
中国科技论文在线 http://www.paper.edu.cn 表 3 两总体均数相等时 I 类错误 Tab. 3TypeIerrorunder the condition of two equal population means 阶段设计 5 阶段 4 阶段 3 阶段 方法 Pocock 法 OBF 法 =1 指数族损耗函数法 =3 指数族损耗函数法 Pocock 法 OBF 法 =1 指数族损耗函数法 =3 指数族损耗函数法 Pocock 法 OBF 法 =1 指数族损耗函数法 =3 指数族损耗函数法 I 类错误 0.053 0.051 0.047 0.048 0.051 0.049 0.053 0.049 0.052 0.051 0.047 0.049 120 3.2 大样本情况下两总体均值不同 在两总体均数不同条件下,按照表 1 的参数设置,各成组序贯设计方法的功效(Power)、 平均样本量(ASN)及平均终止阶段数(AS)如表 4。由表 4 的结果可以看出,各方法的功 效 Power 均能保持在 0.9 左右,随着阶段数的减少,成组序贯设计各方法的平均阶段数均会 125 有所降低,但平均样本量却会有所增大,其中参数为 1 的损耗函数法与 Pocock 法平均样本 量相近;参数为 3 的损耗函数法与 OBF 法平均样本量相近。 表 4 两总体均数不等时功效(Power)、平均样本量(ASN)及平均终止阶段数(AS) Tab. 4Power, average sample number and average stageunder the condition of two unequal population means 阶段设计 5 阶段 4 阶段 3 阶段 方法 Pocock 法 OBF 法 =1 指数族损耗函数法 =3 指数族损耗函数法 Pocock 法 OBF 法 =1 指数族损耗函数法 =3 指数族损耗函数法 Pocock 法 OBF 法 =1 指数族损耗函数法 =3 指数族损耗函数法 Power 0.907 0.903 0.896 0.914 0.890 0.903 0.897 0.909 0.905 0888 0.894 0.890 ASN 363.58 387.37 361.34 396.59 386.59 398.64 372.37 406.60 387.05 413.83 391.05 422.22 AS 2.694 3.398 2.886 3.514 2.340 2.811 2.405 2.890 1.814 2.205 1.926 2.270 在两总体均数不同条件下,按照表 1 的参数设置,不同方法在试验终止时的阶段分布如 130 表 5、表 6 和表 7。由结果可以看出,Pocock 法和参数为 1 的指数族损耗函数法更容易在 前期终止试验,参数为 3 的指数族损耗函数法和 OBF 法则更为保守。 135 - 5 -
中国科技论文在线 http://www.paper.edu.cn 表 5 大样本情况下五阶段设计的试验终止时的阶段分布 Tab. 5Distribution of theterminalstagein five-stage design under the condition of large sample sizes 设计方法 检验结果 Pocock 法 OBF 法 =1 损耗函数 =3 损耗函数 AcceptNull RejectNull AcceptNull RejectNull AcceptNull RejectNull AcceptNull RejectNull 1 0 257 0 27 0 188 0 33 2 0 257 0 197 0 269 0 178 阶段 3 0 193 0 340 0 209 0 279 4 0 121 0 223 0 137 0 262 5 93 79 97 116 105 92 86 162 140 表 6 大样本情况下四阶段设计的试验终止时的阶段分布 Tab. 6Distribution of theterminalstagein four-stage designunder the condition of large sample sizes 设计方法 检验结果 Pocock 法 OBF 法 =1 指数族损 耗函数法 =3 指数族损 耗函数法 AcceptNull RejectNull AcceptNull RejectNull AcceptNull RejectNull AcceptNull RejectNull 1 0 312 0 42 0 257 0 49 阶段 3 0 180 0 334 0 204 0 341 2 0 278 0 363 0 310 0 311 4 110 120 97 163 103 229 91 208 表 7 大样本情况下三阶段设计的试验终止时的阶段分布 Tab. 7Distribution of theterminalstagein three-stage designunder the condition of large sample sizes 设计方法 检验结果 Pocock 法 OBF 法 =1 指数族损 耗函数法 =3 指数族损 耗函数法 AcceptNull RejectNull AcceptNull RejectNull AcceptNull RejectNull AcceptNull RejectNull 1 0 428 0 122 0 351 0 124 阶段 2 0 330 0 490 0 372 0 482 3 95 147 99 289 106 171 110 284 145 由表 8 的结果可以看出,大样本情况下,不同方法在设计阶段数越多的条件下早期拒绝 率越高。其中 Pocock 法和=1 指数族损耗函数法相对于 OBF 和=3 的指数族损耗函数法具 有更高的早期拒绝率。 150 - 6 -
中国科技论文在线 http://www.paper.edu.cn Tab. 8 Theearly rejection probability of different designs underthe condition of large sample sizes 表 8 大样本情况下不同方法的早期拒绝率 设计方法 Pocock 法 OBF 法 =1 指数族损耗函数法 =3 指数族损耗函数法 5 阶段 0.828 0.787 0.803 0.752 总设计阶段 4 阶段 0.760 0.740 0.771 0.701 3 阶段 0.758 0.612 0.723 0.606 155 3.3 小样本情况下两总体均值相同 在两总体均数相同条件下,按照表 2(小样本模拟)的参数设置,指数族损耗函数法的 I 类错误如表 9。由表 9 的阴性研究模拟结果可以看出,损耗函数法的 I 类错误在小样本的 情况下同样能保持在 0.05 左右。 160 表 9 两总体均数相等时 I 类错误 Tab. 9TypeIerrorunder the condition of two equal population means 阶段设计 方法 I 类错误 5 阶段 4 阶段 3 阶段 =1 指数族损耗函数法 =3 指数族损耗函数法 =1 指数族损耗函数法 =3 指数族损耗函数法 =1 指数族损耗函数法 =3 指数族损耗函数法 0.049 0.048 0.050 0.051 0.051 0.050 3.4 小样本情况下两总体均值不同 在两总体均数不同条件下,按照表 2(小样本模拟)的参数设置,各损耗函数法的功效 (Power)、平均样本量(ASN)及平均终止阶段数(AS)如表 10。 165 由表 10 的结果可以看出,各损耗函数法均能在每阶段信息量出现较大偏倚的条件下使功效 Power 维持在 0.9 左右。同样地,随着设计阶段数的减少,损耗函数法的平均阶段数均会有 所降低,但平均样本量会有所增大;其中=1 相对于=3 所需平均样本量要少。 表 10 两总体均数不等时功效(Power)、平均样本量(ASN)及平均终止阶段数(AS) Tab. 10Power, average sample number and average stages under the condition of two unequal population means 阶段设计 方法 5 阶段 4 阶段 3 阶段 =1 指数族损耗函数法 =3 指数族损耗函数法 =1 指数族损耗函数法 =3 指数族损耗函数法 =1 指数族损耗函数法 =3 指数族损耗函数法 Power 0.891 0.889 0.893 0.902 0.912 0.899 ASN 92.85 98.82 94.02 100.28 95.75 100.19 AS 2.936 3.458 2.409 2.819 1.875 2.265 170 最大信息量设计的损耗函数法在试验终止时的阶段分布如表 11、表 12 和表 13。由结果 可以看出,=1 相对于=3 更容易在早期拒绝原假设。 由表 14 的结果可以看出,在小样本情况下,设计阶段数越多,损耗函数法早期拒绝率 越高,其中=1 相对于=3 具有更高的早期拒绝率。 175 - 7 -
中国科技论文在线 http://www.paper.edu.cn 表 11 五阶段设计的损耗函数法终止时的阶段分布 Tab. 11Distribution of theterminalstagein five-stage design with error spending method 设计方法 检验结果 =1 指数族损 耗函数法 =3 指数族损 耗函数法 AcceptNull RejectNull AcceptNull RejectNull 1 0 185 0 38 2 0 264 0 194 阶段 3 0 189 0 285 4 10 144 8 230 180 Tab.12Distribution of theterminalstagein four-stage design with error spending method 表 12 四阶段设计的损耗函数法终止时的阶段分布 设计方法 检验结果 =1 指数族损 耗函数法 =3 指数族损 耗函数法 AcceptNull RejectNull AcceptNull RejectNull 1 0 271 0 87 阶段 3 2 204 3 299 2 0 286 0 309 表 13 三阶段设计的损耗函数法终止时的阶段分布 Tab. 13Distribution of theterminalstagein three-stage design with error spending method 5 99 109 103 142 4 105 132 95 207 设计方法 检验结果 =1 指数族损 AcceptNull 耗函数法 =3 指数族损 耗函数法 RejectNull AcceptNull RejectNull 1 0 391 0 140 阶段 2 0 343 0 455 3 88 178 101 304 185 表 14 小样本情况下不同损耗函数法的早期拒绝率 Tab. 14Theearly rejection probability of error spending methodswith different parameter underthe condition of small sample sizes 5 阶段 0.792 0.755 总设计阶段 4 阶段 0.763 0.698 3 阶段 0.732 0.595 设计方法 =1 指数族损耗函数法 =3 指数族损耗函数法 4 结论 本文主要对成组序贯设计中固定边界值法和损耗函数法的原理进行了介绍,并在不同样 190 本量的条件下对 OBF 法、Pocock 法以及损耗函数法的优缺点进行了比较。尤其是在小样本 情况下,对损耗函数法能否有效地解决信息量异常的问题进行了探讨。从模拟结果来看,在 大样本的情况下,OBF 法、Pocock 法以及损耗函数法均能很好的控制 I 类错误。而在小样 本情况下,OBF 法和 Pocock 法均会因为实际信息量的异常波动而导致期中分析无法顺利完 成。而此时指数族损耗函数法依旧能够很好的控制 I 类错误。因此,在不同样本量的阴性研 195 究中损耗函数法是期中分析方法的较佳选择。 - 8 -
分享到:
收藏