编者按:近期,斯鲁利单抗获得中国NMPA批准的第二个适应症,用于不可手术切除的局部晚期或转移性鳞状非小细胞肺癌(sqNSCLC)患者的一线治疗。该获批主要基于国际多中心、III期ASTRUM-004研究。本文中,复旦大学附属中山医院梁斐教授将详细解读该研究的统计学设计,以加深我们对ASTRUM-004第一次期中分析结果的理解,以及该方案缘何能够获得药监部门的批准进入临床实践。
ASTRUM-004研究的统计学设计
ASTRUM-004研究是一项在既往未经治疗的不可切除局部晚期或转移性sqNSCLC患者中开展的,比较斯鲁利单抗联合化疗与化疗两组间临床疗效和安全性的随机、双盲、国际多中心III期临床试验。该研究的主要终点是无进展生存期(PFS),关键次要终点是总生存期(OS),其他次要终点包括客观缓解率(ORR)和持续缓解时间(DOR)。
该研究之所以选择PFS而不是OS作为主要终点,有两个重要原因:首先,中国药监局已同意在不可切除局部晚期或转移性NSCLC一线治疗的临床研究中以PFS作为主要终点支持新药上市申请,只要PFS的延长具有临床意义和显著统计学差异即可申请上市,并不强制要求OS结果具有统计学差异才能申请上市。其次,目前免疫治疗已经是一线化疗进展后患者的标准治疗,本研究也允许化疗组患者进展后交叉接受斯鲁利单抗治疗,因此会稀释一线治疗的获益,对OS结果的评估带来影响。当然,这种后续治疗或交叉治疗对OS的影响在其他许多晚期实体瘤一线治疗研究中也普遍存在。
虽然该研究以PFS作为主要终点,但仍将OS作为关键次要终点。临床试验的次要终点通常有多个,多数情况下作为主要终点的补充和支持,而且次要终点结果不能作为确证性的结论,也不能写进药物说明书。然而,在某种情况下,有些次要终点可能用于支持药品说明书声称的获益,一般被称为关键次要终点。此时,应将关键次要终点与主要终点共同纳入I类错误控制,即假阳性概率的控制。对于注册性III期临床研究,假阳性概率必须控制在5%以内的水平。只有主要终点的检验达到显著性后,才会考虑关键次要终点的检验。除此之外,通常还要对关键次要终点进行样本量计算,制定完备的统计分析计划;如果有期中分析,还要有详细的期中分析计划。此类设计的一个典型例子是FLAURA研究。在FLAURA研究中,主要终点是PFS,关键次要终点是OS。该研究采用了顺序检验的方式来进行I类错误的控制,在获得PFS阳性结果以后才进行正式的OS统计学分析。虽然FLAURA研究的主要终点并不是OS,但是作为关键次要终点,且经过如此严格的统计学设计,其OS阳性结果仍然可以得到广泛认可,可以写进药物说明书。
ASTRUM-004研究也是采用类似的研究设计,首先进行PFS的检验,结果达到统计学差异后再进行OS分析,而且该研究同时针对PFS和OS进行了样本量计算。
PFS样本量计算
假设对照组安慰剂+化疗(卡铂-白蛋白紫杉醇)的主要终点中位PFS为6个月,斯鲁利单抗联合化疗组相对于对照组的风险比(HR)为0.65,在整体显著水平α=0.05(双侧)下,需要PFS事件218例。
OS样本量计算
假设对照组的中位OS为12个月,试验组与对照组的风险比(HR)为0.7,在相同的显著性水平(α=0.05,双侧)、入组持续时间和PFS研究持续时间设置条件下,必须观察到至少299例OS事件,以达到80%的把握度。
从样本量计算可以看出,虽然ASTRUM-004研究的主要终点是PFS,但是真正决定研究样本量大小的是OS,这也是ASTRUM-004研究样本量比国内同类研究更大、更接近于KEYNOTE-407研究的根本原因。
除此之外,该研究还针对OS制定了完备的统计分析计划,包括两次期中分析和一次最终分析。第一次期中分析在PFS结果达到统计学差异时进行,第二次期中分析预计在累计发生198例OS事件时进行,最终OS分析将在累计发生299例OS事件时进行。三次分析的α界值预计分别为0.0002、0.0012和0.046。
ASTRUM-004研究结果
ASTRUM-004研究的主要终点PFS达到了预设的统计学差异,中位PFS从对照组的5.72个月延长至试验组的8.28个月,HR=0.55(95%C:0.42-0.73),P<0.0001。该研究的HR与KEYNOTE-407研究(HR=0.56)非常接近。虽然跨研究比较需要谨慎对待,但是相对于中位PFS而言,HR是更加适合进行跨研究比较的指标,因为该指标代表了两组患者间的相对疾病进展风险比,反映了两条PFS曲线全程的差异,受到个别患者状态的影响相对较小。而中位PFS一方面受到入组患者基线情况的影响,另一方面其代表性和稳定性不如HR。近年来,ASCO和ESMO分别开发了临床获益评价量表,这些量表均将HR作为评价各个治疗方案临床价值大小的最关键指标。
在主要终点PFS达到统计学显著性之后,ASTRUM-004研究也进行了OS的第一次期中分析。本次分析数据成熟度相对较低,共发生OS事件120例,HR=0.75(95%CI:0.52-1.10),显示出了获益趋势,但是尚未达到显著的统计学差异,还需要等待下一次OS的期中分析或最终分析。
虽然PFS和OS等生存终点通常作为晚期肺癌临床试验的主要终点,但是ORR和DOR等短期终点同样十分重要。ORR包括完全缓解(CR)和部分缓解(PR),该指标直接反映了药物的抗肿瘤活性;DOR是从疗效评定为CR或PR开始,到发生疾病进展(PD)或任何原因死亡的时间。
ASTRUM-004研究的ORR和DOR结果同样出色。ITT人群ORR为64.2%,中国亚组人群ORR高达75%,ITT人群DOR为9.43个月,中国人群DOR为10.64个月。从这些数据可见,中国亚组有四分之三的患者达到PR或CR,而且一旦达到PR或CR,中位持续时间可以达到10.64个月。高ORR和长DOR的结果也为ASTRUM-004研究获得具有临床意义和显著统计学差异的PFS延长奠定了坚实的基础。
小结
ASTRUM-004研究是一项全球多中心随机双盲III期临床研究,主要终点是PFS,关键次要终点是OS。该研究同时针对PFS和OS进行了样本量计算,这两个研究终点的结果都可以支持研究的确证性结论。ASTRUM-004研究中斯鲁利单抗组的PFS延长结果达到了显著的统计学差异,且临床获益程度与KEYNOTE-407研究类似。OS研究结果尚未成熟,本次期中分析中还未达到统计学的显著性,但已表现出明显的OS获益趋势,期待下一次期中分析或最终分析能够获得OS阳性结果。
梁斐
复旦附属中山医院生物统计室统计师
复旦大学循证医学中心成员
上海抗癌协会癌症预防与筛查委员会委员
CSCO青年委员会统计小组成员
以第一作者(含共一)或通讯作者在JCO,Annals of Oncology,JNCI,European Journal of Cancer等杂志发表SCI论著15篇,累计影响因子超过150
以第一作者在NEJM,Lancet,Lancet Oncology,JCO发表Letter 8篇
JNCI,Clinical Cancer Research,Theranostics审稿人
作为统计师参与数十项研究者发起的临床研究,相关成果发表于JCO,Annals of Surgery等杂志
主要研究方向:临床试验设计及统计,临床研究方法学