临床试验是科学评价药物疗效和安全性最可靠的方法,是医药创新产业发展中最为关键且投资最多的环节。近年来,国家制定了一系列鼓励医药创新发展的政策及指导原则,推动了我国自主医药创新产业发展及临床试验能力提升。为进一步提高我国研究人员开展临床试验的能力,国家心血管病中心、中国医学科学院阜外医院国家心血管疾病临床医学研究中心组织临床试验方法学、临床试验监管等多学科领域专家,针对普遍存在疑问和模糊认识的受试者入选、受试者保留、研究终点选择、研究质量控制、信息技术应用及数据安全伦理等临床试验关键环节中的问题,结合国内外相关的指导原则及最新的研究进展,综合国内专家的建议和意见,共同制定本共识,旨在为广大临床试验研究者提供参考和指导,并为相关部门制定临床试验管理政策提供依据。
引用本文: 国家心血管病中心中国医学科学院阜外医院药物临床试验设计与实施中疑难问题处理的专家共识组,中华医学会心血管病学分会心血管病临床研究学组. 药物临床试验设计与实施中疑难问题处理的专家共识. 中国循证医学杂志, 2022, 22(3): 249-260. doi: 10.7507/1672-2531.202109156 复制
1 前言
临床试验是科学评价药物疗效和安全性最可靠的方法,为药物上市和临床循证决策提供坚实的科学依据,是医药创新产业中最为关键且投资最多的环节。近年来,随着鼓励医药创新产业发展政策的出台,我国自主医药的创新产业取得了快速发展,并且已开始走向国际市场。国家药品监督管理局也发布了一系列技术指导原则,旨在提升临床试验能力,规范临床试验活动。与此同时,面对临床试验费用、时间成本日益高昂的现状,优化临床试验的设计和实施过程,完善监管和质控措施,在保证结果可靠的前提下,提高试验的成本效益,是当下亟待解决的主要难题。此外,伦理批准是临床试验实施的前提条件,数据安全和相关的医学伦理问题日益受到重视。
为进一步提高我国研究人员开展临床试验的能力,针对临床试验关键环节的普遍疑问和模糊认识,国家心血管病中心、中国医学科学院阜外医院国家心血管疾病临床医学研究中心组织临床试验方法学、临床试验监管、心血管病学和肿瘤病学等领域专家共同制定此共识,涵盖受试者入选、受试者保留、研究终点选择、研究质量控制、信息技术应用和数据安全伦理等方面,旨在为广大临床试验研究者提供参考和指导。
2 提升受试者的多样性
受试者入选是临床试验正式开始的重要标志之一,如何尽可能纳入更广泛多样的获益群体,保证入选的受试者充分代表上市后的使用人群,是临床试验设计中的一个重要问题。临床试验往往被认为会排除或较少入选某些特定亚组人群,例如高龄、合并肝肾功能不全或女性等,因而难以获得候选药物在这些特定人群中的疗效评价证据。提升受试者的多样性,纳入更为广泛的适应证人群,有助于更好地评估候选药物在特定亚组人群中的疗效和安全性。美国食品药品监督管理局于2020年11月发布了“改善临床试验人群的多样性—入选标准、招募措施和试验设计的行业指南”[1],该指南提倡临床试验申请人扩大受试者的合格标准,避免不必要地将特定亚组人群排除在外。我国目前尚没有针对如何提升受试者多样性的指导原则。本共识将从受试者入选标准的制定、受试者相关因素和监管机构因素3个方面进行阐述,为提升受试者多样性提供建议举措,以期为我国的临床试验研究者提供参考指导。
2.1 适当拓宽入选标准,避免不必要的排除标准
在制定入选标准时,研究者应考虑临床实践中可能使用该药物的患者的多样性,包括年龄、性别等特征,适当扩大入选标准可在一定程度上提高临床试验结果的可推广性[1],也可考虑采用适应性设计(adaptive design,详见本文“5适应性设计及其应用”),在获得更多安全性数据后,扩展到更大人群范围[2]。证据充分时,确证性临床试验不必限于成人人群,可考虑同时纳入儿童和青少年,甚至妊娠妇女。
在制定排除标准时,在确保受试者的安全和实现研究目标的前提下,应评估每条标准是否都确有必要,并剔除或修改非必要的排除标准,例如器官功能障碍较轻但可耐受试验药物,且有较大可能从试验中获益的受试者人群。通过早期临床试验[1],分析不同受试者人群的药物代谢特征,例如老年人和肝肾功能障碍者,能够为后期临床试验中是否有必要排除某些受试者提供客观依据,也可为不同受试者人群中的剂量优化方案提供参考依据。
对于某些临床试验类型,放宽入选标准十分重要。在富集(enrichment)适应性设计的临床试验中(详见本文“适应性设计的主要类型和注意事项”),应尽可能设定更为广泛的入选标准,避免排除某些特定的受试者人群。富集是指前瞻性地使用特定的临床或生物学特征筛选受试者人群,使得在该人群中检测到药物效应(如果确实存在药物效应)的可能性比未选择人群中更大。合理地放宽入选标准能够从更广泛人群中筛选出更多潜在的获益群体。此外,由于受试者数量十分有限,对于罕见病的临床试验,避免入选标准过严,保证受试者最大限度地参与亦十分重要。在很有限的情况下,如果不存在非预期安全性问题,且早期试验用药并不改变疾病进程,可考虑将已参加过早期安全性试验的受试者再次纳入到疗效性探索或确证性试验中[1]。
2.2 受试者相关因素
研究者应考虑采取包容性的入选措施,帮助易被忽视和较少被纳入的亚组人群参加临床试验。可与社区、患者权益组织等建立联系,获得其协助,以更好地理解潜在受试者的需求,从而有针对性地调整入选措施[3]。在研究中心的选择上,可考虑少数族裔或少数民族等聚居区附近的医院[4]。在工作人员的选择上,考虑不同的文化背景和语言差异,招募多元文化背景的工作人员帮助有语言沟通障碍的受试者参加。
在运行过程中,研究者可考虑采取措施减轻受试者负担,从而让更多受试者愿意参与临床试验,在一定程度上有助于改善受试者的多样性[5]。例如调整随访间隔时间或时间窗,或采取电话、邮件或视频等方式来替代面对面访视,特殊情况也可考虑由研究人员去受试者家中访视。对于罕见病患者,由于地理分布上较分散,疾病本身也可能不同程度地影响其出行,研究人员需要付出更多努力保证受试者的入选。也可考虑在试验结束后进行开放标签,使安慰剂组患者也能获得活性研究药物,从而鼓励更多受试者参加临床试验。
2.3 监管机构相关因素
监管机构的指南或政策文件,有助于引导研究者或申办者在临床试验设计和实施时提高临床试验入选人群的多样性,充分考虑各国人群和候选药物潜在适用人群的年龄、性别、种族等特征,提前制定好计划,招募具有不同人口学特征的受试者,尤其是常常被忽视和较少纳入的一些亚组人群,如少数族裔和老年人群等。要求使用统一的人口学变量格式和定义,便于对不同研究的数据进行汇总分析,也便于对不同研究的结果进行比较。此外,监管机构要求报告不同人口学特征亚组人群的疗效和安全性结果,可更全面地反映候选药物的疗效和安全性[6]。
此外,监管机构还可设置专门的促进受试者多样性的部门,采取多种措施,如制作临床试验科普材料、通过多媒体宣传临床试验参与的重要性等,提高广大人群对临床试验的认识,帮助被忽视的群体参与临床试验[5,7]。
综上所述,适当拓宽入选标准、采取更具包容性的入组措施和一些监管措施,能够提高受试者对药物适用目标人群的代表性,帮助医生了解药物针对更大范围人群的安全性和有效性,使更多群体获益。
3 受试者失访与剔除
在临床试验的实施过程中,难免会出现受试者的失访、违背纳入与排除标准和依从性差等问题。失访率高或不恰当地处理相关数据都会严重影响试验结果的可靠性。研究者必须考虑在设计和实施阶段采取措施减少受试者的失访,并谨慎处理失访者的数据。对于很多研究者而言,这些问题仍然是较大的挑战。在面对违背纳入排除标准、违背方案合并用药、错误分组、依从性差等情况时,如何进行受试者剔除(excluding patients from analysis)也是较为棘手的问题。
3.1 失访处理
失访(loss to follow- up)是指受试者在临床试验过程中由于各种原因没有按预定方案完成随访,研究者未能获得其随访数据,属于脱落(drop out)的一种情况。随着脱落率升高,试验结果的准确性下降。
如前所述(本文“受试者相关因素”),研究者应该在设计阶段考虑受试者参加临床试验可能存在的困难,采取合理措施,以减少失访的风险。常见的失访原因包括受试者搬迁、失去联系、发生药物不良反应等。受试者失去联系是导致失访的常见原因之一。在发生失访时,研究者应该采取补救措施尽可能获得随访数据。为避免受试者失去联系,签署知情同意书时,在征得受试者及其家属同意的情况下,应尽可能留下多个受试者亲属(特别是不与受试者同住的亲属)的联系方式。当受试者搬迁时,可通过上门访问等方法尽最大可能获得随访数据。对于因药物不良反应导致的失访,应尽可能与受试者及其家属取得联系。一方面,需要详细收集记录不良反应的程度和分类、与试验药物的相关性、起止时间和转归,并按照研究方案、医疗规范及时妥善处理;另一方面,应取得受试者及家属理解,受试者发生不良反应而无法耐受治疗时可停止研究治疗,但仍需按照研究方案的要求完成完整随访。
常用缺失值处理方法有:末次观测值结转、基线观测值结转、均值填补、回归填补、多重填补、最差值填补及临界点法。对于失访造成的主要疗效指标的缺失,应将方案和统计分析计划中事先规定的数据填补方法作为主分析方法进行处理[8,9],并将上述其余填补方法作为敏感性分析方法。如果敏感性分析结果与主分析结果一致,说明结果可靠。一般来说,缺失数据的处理方法应遵循保守疗效估计的原则。
3.2 受试者剔除
在临床试验中,可能发生违反纳入排除标准、违反方案规定的合并用药、交叉治疗、依从性差等情况,不能简单予以剔除。应遵循方案中事先规定的受试者剔除原则,确定统计分析数据集。受试者剔除标准需要在试验数据库锁定之前制定。对于剔除的每一位受试者,都需要给出详细的理由。定义分析数据集时遵循2个原则[9]:① 尽可能减少偏倚;② 防止增加Ⅰ类错误概率。一般情况下,对于优效试验,意向性治疗(intention-to-treat,ITT)是数据分析的基本原则,要求将所有随机化的受试者按照随机分配的组别进行分析,不考虑受试者实际接受了何种治疗,也不考虑是否违背方案或失访。遵循ITT原则对疗效的估计是最保守的,要求对所有随机化受试者完成随访以获得研究结局。这在实践中有时难以达到,只能获得尽可能接近符合意向性治疗原则的理想受试者集—全分析集(full analysis set,FAS)。FAS仅在非常有限的情况下才可剔除已经随机化的受试者,通常包括:违反重要入选标准、受试者未接受试验用药物的治疗、随机化后无任何观测数据等。需要强调的是,剔除每一位受试者都需要对剔除的合理性进行充分论证,并事先说明。其他常用的分析数据集还包括符合方案集(per protocol set,PPS)和安全性分析集(safety set,SS)等。PPS纳入的受试者需要有较好的方案依从性,需要完成事先设定的试验药物的最小暴露剂量,主要指标的数据均可获得,且没有重大违背试验方案。随机化后至少接受一次治疗且有安全性评价数据的受试者均应纳入SS。
对每一位从统计分析数据集中排除的受试者,都应该在盲态审核时阐明理由,并在揭盲之前以文件形式写明。根据不同的研究目的,需要在临床研究方案和统计分析计划中明确描述3个数据集的定义,同时明确定义违背方案、脱落或缺失数据的处理方法。在优效试验中,应采用ITT/FAS作为主要分析数据集;在等效或非劣效试验中,如果试验质量欠佳,发生较多失访、退出、替代治疗或组间交叉等问题,可能会缩小组间疗效差异,此时采用ITT/FAS容易得出假阴性结论,需要同时采用ITT/FAS和PPS分析。两个数据集结论一致时可增加试验结果的可信度。如果结论不一致,可能存在偏倚,应分析并合理解释出现不一致的原因。
3.3 在设计阶段提高受试者依从性,减少失访和受试者剔除
出现失访或需要将受试者从统计分析数据集中剔除,都是比较被动的局面,更为明智的做法是,从研究设计阶段即充分考虑受试者依从性和研究质量问题,制定合适的措施提高受试者的依从性,例如:① 在随机之前排除可能搬迁或不依从的受试者;② 尽量使干预措施简单且易于实施;③ 采用易于测量的指标,提高依从性;④ 设计合理的随访频次。此外,在研究实施过程中,研究者与受试者应建立良好的人际关系,研究者应始终关注受试者,及时处理实施过程中发现的问题。通过科学严谨的设计、规范高效的实施,尽可能降低受试者的失访率,提高随访质量,将尽可能多的受试者纳入统计分析数据集,获得真实准确可靠的临床试验结果。
4 研究终点和多终点设计
研究终点是评价药物疗效的关键指标,设定多个研究终点在临床试验并不少见。对于Ⅰ/Ⅱ期临床试验,多终点十分常见,但是由于是探索性研究,样本量估计时可不考虑对Ⅰ/Ⅱ类错误的控制。对于Ⅲ期确证性研究,双终点和多终点的应用亦较常见,能够增加试验效率[10-11],但须注意遵循相应的原则。下面将重点介绍临床试验研究终点的定义、分类和选择原则,并以抗肿瘤新药临床试验为例,阐述临床试验多终点的设计考量要点。
4.1 临床试验的研究终点
4.1.1 定义
研究终点是可通过客观测量并辅助研究者决定是否接受或拒绝无效假设(两种治疗方法或策略之间在研究终点上没有统计学意义的显著差异,H0)的一个重要指标;在特定时限内的临床试验中,研究终点是指对临床结局的观测与评价,包括生存期、生活质量/临床症状等。
4.1.2 分类
基于临床获益的价值,可分为:① 临床终点(clinical endpoint),直接代表最重要的临床获益,即延长生存,改善症状和生活质量,主要用于常规批准新药上市(traditional approval,TA)。② 替代终点(surrogate endpoint),可用于加速批准(accelerated approval,AA),包括两大类,一是间接代表临床获益且经过验证与临床终点相关的替代终点,二是未经验证但很可能预测临床获益的替代终点。
基于需回答的研究问题的重要性,可分为:① 主要终点(primary endpoint):是指与临床试验所关注的主要问题(主要研究目的)直接相关的,能够提供最具临床意义和令人信服证据的研究终点,样本量计算和评价试验是否达到主要目的都是基于主要终点。② 次要终点(secondary endpoint):一般为多个,可包括关键次要终点(与主要终点共同纳入Ⅰ类错误控制,用于支持药物说明书声称的获益)。③ 探索性研究终点:一般与药物疗效预测标志物或者试验药物引起的机体变化有关。
基于依据来源,以抗肿瘤药物临床试验的研究终点为例,可分为:① 生存相关研究终点。描述死亡事件的终点:如OS(overall survival,总生存,从治疗开始或随机至死亡的时间)和OS率(特定时间段内生存患者占试验刚开始时总患者数的比例)等。基于肿瘤测量的终点:包括ORR(objective response rate,客观缓解率,治疗后达到完全缓解或者部分缓解的受试者占试验刚开始时总患者数的比例),DCR(disease control rate,疾病控制率,治疗后达到完全缓解或部分缓解及疾病稳定的受试者占试验刚开始时总患者数的比例),DoR(duration of response,疗效持续时间,治疗后达到完全缓解或部分缓解的患者,从首次评估有效到疾病进展或死亡时间),PFS(progression free survival,无进展生存,从治疗开始或随机入组至疾病进展或死亡的时间),DFS(disease free survival,无复发生存,从随机入组到疾病复发或任何原因导致死亡的时间),EFS(event free survival,无事件生存,从随机入组到疾病复发或任何原因导致死亡的时间)等。如以肿瘤测量相关研究终点为唯一疗效指标,药物上市批准前可能需要评价临床终点如OS的临床试验验证。② 生活质量相关研究终点:主要为症状评估终点,包括症状减轻或缓解时间、生活质量(quality of life,QoL)和癌症症状进展时间(time to progression of cancer symptoms,TTP)和患者报告结果(patient report outcome,PRO,即直接来自于患者对自身健康状况、功能状态及治疗感受的报告,不包括医护人员及其他任何人员的说明)。需要注意的是,包含生活质量的复合症状终点中的不同症状指标应具有相似的临床重要性,其临床获益不仅归因于单个指标的改善,对此类复合症状终点进行分析时应包含对具体单个指标的分析[12]。
4.1.3 临床终点的选择
① 必要条件:具有临床意义且与疾病过程相关,例如PFS是用于评估药物能否延迟疾病进展;能够回答试验的主要问题,例如DFS是用于评估治疗是否延迟复发);终点事件发生频率足够高,使研究具有足够的统计能力,例如OS适用于生存期短的人群,心血管疾病的临床试验通常选择主要不良心血管事件(major adverse cardiac event,MACE)、心血管死亡或者全因死亡等硬终点指标。② 评估优化:若结果存在偏倚或不确定性,需要通过统计学方法优化;需考虑是否计划加速审批,如ORR、PFS等终点均有可能支持加速审批。③ 如计划在一个研究中回答多个临床问题,应考虑选择多终点。
4.2 临床试验多终点
临床试验多终点是指一项研究中同时设置可能代表试验药物临床获益的多个指标作为研究终点。临床试验多终点会产生多重性问题(multiplicity issues),即在一项完整的临床研究中,需要经过不只一次的统计推断(多重检验)得出研究结论的相关问题[13]。常用的临床试验多终点包括以下3类:① 共同主要终点(co-primary endpoint):要求2个或以上不同的主要终点均有统计学显著意义时才认为研究药物具有疗效。② 多终点(multiple endpoint):评估几个主要终点,其中至少一个具有治疗效果就能确定临床获益。③ 复合终点(composite endpoint):将多个临床相关结局合并为一个单一变量,抗肿瘤药物的临床试验中常用PFS、DFS、EFS等复合终点;心血管疾病的临床试验中常用MACE作为复合终点。
临床试验多终点的使用场景及统计分析注意事项。确证性临床试验中:单一主要终点较为常见,但某些情况下会涉及多个主要终点,包括共同主要终点和多终点两类,前者要求多个主要终点均具有统计学意义,后者则是多个主要终点中至少一个有统计学意义就认为研究药物有效。二者在进行方案的统计学设计时需要注意Ⅰ类错误和Ⅱ类错误膨胀问题。① 共同主要终点:会增大Ⅱ类错误发生率,从而降低检验效能。检验效能降低的程度与主要终点的个数和主要终点之间的相关性有关,个数越多、相关性越弱,检验效能降低的幅度越大。② 多终点:会增加Ⅰ类错误发生率,需要采取适当的策略和方法控制总的Ⅰ类错误率(family-wise error rate,FWER),如进行多重性调整。可通过统计学方法的α分配和/或α传递来管理Ⅰ类错误,如:平行策略(Bonferroni法、前瞻性α分配法),序贯策略(Holm法、Hochberg法、固定顺序法、回退法),分阶段的整体决策策略(较经典的α分割方法有Pocock法、O’Brien-Fleming法和Haybittle-Peto法)等[10,14]。在非确证性临床试验中:主要终点为多个的情况较常见,不需要统计学假设,不需考虑Ⅰ类和Ⅱ类错误的膨胀问题。
4.3 临床试验多终点的选择
临床试验多终点在抗肿瘤新药研发领域更为多见,因而以此为例说明多终点选择需要考量的要点。首先,最常见的抗肿瘤新药确证性研究的多终点选择为PFS和OS,如果设定共同主要终点,PFS和OS终点必须同时达到,临床试验的样本量估算按照OS的统计学假设来计算;部分研究设计以PFS和OS作为多终点,两个终点达到其一即为研究成功,需要进行多重性调整,可通过分配或者传递α值来减少Ⅰ类错误。
目前抗肿瘤新药临床试验常用到篮式设计(一种疾病多个药物)、伞式设计(同种药物多个疾病)和平台设计(多种药物、多个疾病)等复杂设计方案,如果子研究是独立研究,且回答各自的临床问题,比如针对不同的肿瘤或者目标人群等,则无需进行多重性调整。
在临床试验方案和统计分析计划中,应事先明确多重性问题和多重性调整的策略和方法,并鼓励在设计阶段与监管机构充分沟通。同时,若在临床试验过程中进行调整,亦应与监管机构及时沟通。
5 适应性设计及其应用
随着创新药物尤其是抗肿瘤新药的不断涌现,临床试验设计的要求不断提高,尤其是很多新靶点的制剂或免疫制剂具有独特的药理特点,例如剂量-反应关系不唯一、延迟毒性和延迟有效性等,为探索药物的安全性和有效性带来了巨大挑战。与此同时,Ⅰ期、Ⅱ期和Ⅲ期临床试验的边界越来越模糊,创新试验模式往往提倡各阶段的融合,以提高数据利用度并加快药物的研发进程。
适应性设计是一类创新性的临床试验设计,是指按照预先设定的计划,在期中分析时使用试验期间累计的数据对试验设计的一个或多个方面做出相应修改的临床试验设计,修改的内容和目的包括:修正初始设计的偏差,提高研究的统计学效能,使试验更加符合伦理学要求;增加研究的外推性和可解释性,提高试验效率,降低时间和成本投入[2,15]。
近年来,临床试验研究者、药物研发企业和监督管理机构对适应性设计的临床试验给予极大关注,各国政府监管机构陆续出台适应性设计的相关指导原则,例如美国食品药品监督管理局于2019年发布了《药物和生物制品临床试验适应性设计行业指南》,我国国家药品监督管理局亦于2021年发布了《药物临床试验适应性设计指导原则(试行)》。尽管如此,很多研究者对适应性设计的应用原则、范围和注意事项仍缺少充分地了解和认识,本共识将主要针对上述问题进行阐述。
5.1 适应性设计的原则
适应性设计既可用于探索性临床试验,亦可用于确证性临床试验。在选择使用适应性临床试验之前,需要考虑以下4项基本的应用原则:① 在期中分析阶段进行的方案修改需要在原始方案中预先设定,而非临时提出,原始方案中应该明确说明期中分析的时间、次数、适应性设计的类型、所使用的统计方法及期中分析目的等;② 严格和充分控制Ⅰ类错误在合理水平(例如,双侧检验水平为0.05);③ 选择准确的效应估计方法,减少偏倚的引入,确保结果的可靠;④ 避免期中分析的结果泄露从而影响研究后续操作和受试者入组,保证临床试验的完整性。期中分析或方案调整应由独立的数据监察委员会(independent data monitoring committee,IDMC)执行,以保证申办方和研究者处于盲态。有关IDMC的更多内容,可参阅《药物临床试验的生物统计学指导原则》等。
5.2 适应性设计的主要类型和注意事项
适应性设计可体现在研究设计的多个环节,下面简述不同的适应性设计类型及其需要注意的问题:
① 成组序贯设计(adaptive group sequential design):预先计划在试验中进行一次或者多次期中分析(interim analysis),根据每次期中分析的结果做出后续的试验决策。期中分析的时间点一般基于累计数据的占比(如受试者入组比例或发生目标事件数的比例等),期中分析的次数、时间点及I类错误调整方法需要在试验方案中给予明确规定,在试验实施过程中严格按照方案执行,不可随意进行计划外的期中分析,以确保整个试验的科学性和完整性。如果存在以优效性提前终止试验的可能,选择时间点时应考虑期中分析时的信息量是否可提供足够的检验效能。
② 样本量再估计(sample size re-estimation):根据预先设定的期中分析,利用累计的试验数据重新估算样本量,以保证在可容许的Ⅰ类错误概率范围内达到预先设定的目标。同时需要注意:如果重新估算得到的样本量比原样本量大,那么接下来的研究中采用新样本量;否则仍使用最初估计的样本量。
③ Ⅰ/Ⅱ期或者Ⅱ/Ⅲ期无缝设计(phase Ⅰ/Ⅱ,Ⅱ/Ⅲ two stage seamless design):无缝设计是将传统的两个独立的临床试验阶段,整合为一个试验的2个阶段,将前一阶段临床试验结束时的分析作为期中分析,并据此进行后期试验的设计或者剂量选择。无缝设计可缩短临床试验周期,在保证一定的检验功效的前提下,使用相对较少的样本量达到两期试验的目的。其中,Ⅱ期试验结果会影响后续Ⅲ期试验的Ⅱ/Ⅲ期无缝设计,需要在研究设计中事先设定自适应相关内容,使最终分析可使用Ⅱ/Ⅲ期研究中的全部数据,尤其需要控制试验的总体Ⅰ类错误率,应使用适当的统计学方法来防止Ⅰ类错误膨胀,常用的有Fisher组合检验法及序贯设计方法等。
④ 适应性富集设计(adaptive enrichment):根据试验的前期结果分析哪些对象最可能获益,在后续试验中增加其入组比例,从而达到放大治疗效果、避免更多受试者暴露于可能的毒副作用的目的,同时也提高了试验效率。例如根据研究适应证不同,使用实践经验、病理学特征、基因组学特征或者其他研究经验等方法来确定受试者类型等。例如基于标记物的最优序贯富集设计(optimal sequential enrichment design,OSED),首先对阳性生物标记物亚组进行两阶段设计,在确定药物对阳性生物标记物亚组有效之后,对阴性标记物亚组进行两阶段设计,该设计的期中决策准则是通过最大化一个特定的效用函数,并同时控制Ⅰ和Ⅱ类错误而得到。
⑤ 适应性主方案试验设计(master protocol with adaptive design):指方案中包含多个子方案,如篮式设计(一种疾病多个药物)、伞式设计(同种药物多个疾病)、平台设计(多种药物,多个疾病)等。在篮式设计的临床试验中,评估药效的两种常用方法是汇集分析和独立分析。汇集分析有助于提高统计检验功效,但当试验药物在不同的篮子中的疗效有差异时,该方法将导致严重的估计偏倚和Ⅰ类错误率膨胀。而独立分析仅使用每个篮子的数据独立评估试验药物在此篮子中的疗效,在篮子之间并不进行任何信息借用,因此避免了估计偏倚和Ⅰ类错误膨胀问题,但由于每个篮子的样本量有限,往往缺乏足够的检验效能。考虑到不同篮子间异质性,可利用试验中观测到的数据自适应地在篮子之间借用信息,包括:两阶段篮子设计、贝叶斯分层模型篮子设计、校准贝叶斯分层模型的篮子设计及潜在亚组篮子设计等。平台研究的适应性设计方法主要有MIDAS(multi-candidate iterative design with adaptive selection)贝叶斯Ⅱ期临床试验设计方法,允许以高效、无缝的方式持续筛选大量候选药物,只需要一个主方案和一个对照组,有利于简化试验过程,降低新药研发成本。
⑥ 适应性标志物设计(biomarker-adaptive design):根据临床试验进行过程中探索的分子标志物进行后续临床试验入组人群筛选的设计。常用的设计方法有标志物策略设计(marker-strategy design,MSD),是用于识别和验证预测标志物的设计。还有标志物分层设计(marker-stratified design,MSTD)是根据标志物阳性或阴性对受试者进行分层,然后在每一层内将受试者随机分配到对照组或试验组进行治疗。其他还有最优标志物自适应设计等。
⑦ 适应性剂量递增(adaptive dose escalation):在I期试验中根据前期爬坡剂量的结果进行后续剂量选择的方法,主要用于确定试验药物的最大耐受剂量和剂量限制性毒性,常用的设计方法包括贝叶斯基于算法的Rolling6设计,基于模型的TITE-CRM设计、DA-CRM设计、TITE-BOIN设计、TITE-Keyboard设计、Simon两阶段设计等。
⑧ 多重适应性设计(multiple adaptive design):一个试验中采用大于一种适应性方法的方案设计,此时应注意控制概率Ⅰ类错误。
其他适应性设计的方法还包括:适应性治疗转换(adaptive treatment-switching),无效药物剔除设计(drop-the-loser design),假设性自适应设计(adaptive-hypothesis design),多臂多阶段(multi-arm multi-stage)设计等。
5.3 其他考量
设计适应性临床试验需要结合实际情况考虑下列问题。首先,原则上一般不允许在试验进行过程中进行非预设的变更,但在临床试验的操作实践中,基于试验过程中产生的数据提示需要进行非预先设定的修改时,应经过谨慎考虑后,在保证不破坏合理性、完整性和可行性的前提下做出修改,并需要提前与监管机构进行沟通确认。第二,适应性设计通常会与先进的统计学方法和科学技术相结合,例如贝叶斯方法、新颖替代终点指标及模拟技术等,操作更复杂,通常需要更高的临床试验实施质量保驾护航。研究者需要充分考虑获取的信息量、受试者招募速度、研究者的理解程度和时间成本等因素,如果适应性设计获取的信息少于传统设计,则可能导致入选进度变慢、纳入的受试者特征发生改变、或因试验设计过于复杂,导致研究质量受到严重影响,此时选择适应性试验设计应该谨慎。
此外,要注意的是,基于外部数据对进行中的临床试验做出的修改通常不属于适应性设计,例如同一类药物刚完成的试验显示某主要终点的选择不合适,或新发布的相应指南对主要终点另有定义,需要修改主要终点;新的标准治疗的改变,需要修改标准治疗的对照组,或因无法继续入组患者而需要提前终止试验等。
总之,适应性设计由于其灵活的特点,能够节约研发成本和投入时间,在某些情况下也更加符合伦理要求,因而相关的研究应用日趋广泛,但是适应性设计较传统临床试验更为复杂,对研究运行质量的要求更高,且无法弥补试验中已经存在的缺陷,因此在设计、实施和管理中要更为谨慎。
6 大规模试验应采用简单易行的运行和质控方式
在心血管疾病等慢病领域,评价药物对重要临床结局的影响往往需要开展大规模的临床试验反复验证,入选超过数千例受试者,随访数年[16-17]。大规模是结论可靠的重要保障,唯有采用简单易行的操作方式,才能实现[18]。大规模与小规模临床试验存在的质量风险不尽相同,应结合其特点采用针对性的运行管理方法与质控措施。首先,大规模临床试验应采用易于确定且重要的临床终点,例如死亡、心肌梗死等,其作为客观指标判断依据明确,基于受试者的报告很少会发生遗漏。其次,由临床事件委员会(clinical event committee,CEC)按照统一的标准对可能的终点事件进行中心性判定,误判的可能性会降到最低。再次,试验采用双盲设计,且样本量足够大,个别受试者数据记录的偏差并不会影响研究结论。相反,如果操作过于复杂,研究规模不足,可能对研究结论造成致命性影响。简单易行意味着在设计和运行方面简单易行,紧抓决定临床试验质量的关键环节,避免让非必需内容徒增成本和复杂性。因此,简单易行的方式不是牺牲研究质量,而是为更好地保障研究结论的科学性。
近20年来,全球临床试验的领军机构之一英国牛津大学在SHARP[19]、HPS-THRIVE[20]、REVEAL[21]和EMPA-KIDNEY等一系列国际多中心大规模药物临床试验中发展了简单易行(streamlining)的运行质控方式,并不断完善,已得到美国食品药品监督管理局等国际权威机构的认可,代表了未来临床试验方法学的重要趋势。鉴于此,我们对简单易行的质控运行方式的核心环节进行简介。
6.1 研究数据采集
完善的电子数据采集系统(electronic data capture,EDC)是大规模临床试验以简单易行方式运行的重要基础。EDC系统应界面友好,只采集必要的数据,研究数据主要来自于详细且结构化的受试者访视,以及本地和中心实验室结果,不使用纸质的病例报告表(case report form,CRF)。在大规模的临床试验中,受试者是最直接的数据来源,因为其能够报告所有的医学情况,也包括不良事件(adverse event,AE)和终点事件。在长达数年的随访中,受试者可能在不同的医院接受诊疗,研究者仅依靠本院的病历系统未必能完全了解受试者的所有就医信息,所以只有受试者能够提供本人最新的健康和用药信息。在每次随访时,研究者收集受试者的所有住院和任何其他不良事件的详细信息,并特别询问因药物导致的严重不良事件。研究者直接将来自于受试者报告的信息/数据录入到EDC中(对于难以从受试者本人处获得的信息/数据,也可从亲属或者其他医生处获得)。此外,针对任何不可信或不一致的数值或回答,电子系统中将自动弹出消息予以警示,解决该问题后数据才能保存。这些措施有助于确保数据的质量。
基于前面所述的理由,即使受试者忘记而漏报少量的事件也不会影响研究结果的可靠性[22]。因此,此类试验实施过程中,可不要求研究者定期查阅纸质或者电子版的医院记录来发现不良事件,反而是基于电子化的研究数据的中心性监查可有效帮助、及时发现潜在的问题。
6.2 基于风险的监查
在简单易行的运行方式中,基于风险的监查(risk based monitoring,RBM)方法是提高数据质量和保证受试者安全的重要手段[22]。基于风险的监查需要结合研究设计的复杂程度,包括终点类型、研究人群的复杂性、试验药物的安全性等因素,全面评估可能影响临床试验质量和受试者安全的风险,针对关键的风险进行监查。
监查可采用中心化远程监查与现场监查相结合的方式进行。中心化监查是保证研究质量的最主要手段。EDC除了提供实时的CRF信息之外,还能够同时记录研究者数据采集等操作的相关信息。基于电子化的研究数据,建立研究管理系统,进行中心性的数据分析,有助于及时发现传统的现场监查难以发现的问题。利用中心性监查能够识别明显偏离平均水平的研究中心,发现访视问卷完成耗时过短、访视问卷集中于非正常访视时间完成等异常现象,这些现象提示数据质量可能存在问题,从而为针对性监查提供线索。基于实时数据分析的中心化监查可发现90%的重要问题[22],其效力远远大于现场监察。
现场监查作为中心化监查的补充,可核实中心化监查发现的疑点或到现场检查必要的记录,帮助研究者解决研究中出现的问题,必要时对其提供额外的针对性培训。在可能的情况下,经受试者同意,监查员可观察受试者访视的过程。通过现场监查,监查员可根据研究需要随机抽检各种记录,但视研究的规模和具体情况而定,不一定需要常规检查病历以发现漏报的不良事件、严重不良事件或其他研究终点。中心化监查的结果可用于指导现场监查的时间和性质。
6.3 源文件归档
源文件指临床试验中产生的原始记录、文件和数据。在简单易行的临床试验中,电子CRF以电子数据方式将受试者的回答记录保存于服务器,便于核查,其中包括依从性评估、受试者报告终点事件、不良事件和研究药物发放记录等。电子CRF的记录方式与门诊病历记录一样,完成后导出打印,可作为门诊病历归档,遵循《药物临床试验质量管理规范(2020)》关于“以患者为受试者的临床试验,相关的医疗记录应当载入门诊或者住院病历系统”的要求[8]。此外,研究的源文件还包括当地或中心实验室分析结果,不良事件(AEs)的相关支持性资料等。
总而言之,采用简单易行的运行管理及质量控制方式,确保试验质量,是未来大规模临床试验发展的趋势。在研究者发起的临床试验中,如果药物的安全性已经有非常充分的证据,可采用更加简单易行的方式。近期由美国杜克大学研究团队在《新英格兰医学杂志》发表的ADAPTABLE研究[23],旨在比较阿司匹林81 mg/日和325 mg/日对于预防严重血管事件的疗效和安全性,采取了电子知情同意书、受试者门户网站随访、受试者自行购买研究药物、受试者自报研究结局等简单易行方式,受到了广泛关注。
7 信息技术的相关问题
新冠肺炎疫情对当代临床试验的格局产生了重大影响,导致受试者入组困难、受试者依从性降低和研究时间延长等诸多问题,数字化信息技术有望成为一项重要的应对策略。数字化、远程化和智能化等新型信息技术的发展推动了临床试验范式的变革,为临床试验的实施和开展带来了新机遇。充分利用这些技术优势,能够在一定程度上扩大受试者的招募范围,加速入组和降低脱落率,还能够实现远程监管,从而提升临床试验效率,降低临床试验成本[24-25]。但是,如何将信息技术合理高效地应用于临床试验,合理规避应用过程中的伦理风险和数据安全问题,并采取措施进行质量控制,仍然是一项重大挑战。本共识将针对上述问题的应对策略进行探讨。
7.1 临床试验设计的信息化适应
数字化背景下,在方案设计时,研究者需要充分考虑数字化、远程化、智能化等信息技术的适用性及应用场景,充分结合目标适应证的临床特点选择适当的信息化媒介[26]。需要强调的是,并不是所有临床试验、受试者人群或适应证都能采用信息化手段,例如肿瘤I期临床试验和某些急性疾病的研究,涉及到影像、病理活检、高风险干预等内容,需要研究者密切监测并随访受试者,可能不完全适合远程化技术的应用。此种情况下,考虑数字化、智能化与传统临床试验相结合的模式,是一种较为可靠的实施策略。近年来有研究者采取网络社交媒体招募受试者,这种方法可能引入选择性偏倚。研究者应该谨慎使用远程化手段评估的研究终点,其有效性需要进行充分验证。在临床试验设计时,需根据临床试验的特点,采用最合适的信息化技术。当缺乏足够信息进行判断时,可先开展小规模预试验评估可行性[25]。
7.2 信息技术在临床试验中的伦理问题
在信息技术的应用中,研究者需要重点关注某些伦理问题,尤其是保证远程参与的受试者的充分知情和同意确认。数字化技术支持下的临床试验中,通过网络招募的受试者可能面临个人信息和个人隐私的泄露(如个人身份信息、地理位置信息等)的巨大风险。应对这些问题,必须要事先制定与电子知情同意相关的标准操作规程,采用包括文本、图形、音视频、生物识别器和读卡器等方式传达与研究有关的信息,并获得知情同意的记录[26],同时对个人信息和个人隐私进行脱敏,尽可能地保护受试者的个人权益。远程签署电子知情同意时,应符合《电子签名法》等相关法规的相关要求。相关内容在“保证数据安全的措施”中有更详尽阐述。
7.3 数据的安全性、可靠性和合规性
在临床试验运行过程中,应确保数据能够安全可靠地采集、传输和储存。研究者应参考监管机构发布的相关指导原则以及行业专家达成的共识(或者规范),例如《药物临床试验质量管理规范》《新冠肺炎疫情期间药物临床试验管理指导原则(试行)》《药物临床试验的电子数据采集技术指导原则》及FDA 21 CFR Part 11等,确保流程的合规性及数据的可靠性和安全性。
数据采集的信息化系统需要经过规范测试和严格认证,并将网络安全作为认证的重要内容,确保系统的安全性、稳定性和合规性。在数据访问权限上,依据“需要知道”和“最少特权”的安全原则[25],定期审查和更新,以防出现隐私泄露的风险。此外,应用区块链技术可在一定程度上降低数据泄露的风险[27]。
7.4 实施过程中的质量和风险管控
电子化数据采集及管理方式在临床试验中的应用,对质量风险管理提出新的要求。在临床试验院外操作授权、远程受试者招募、电子化知情同意、远程访视和监查、受试者隐私保护等远程化、智能化操作方面需要设立严格的风险控制措施。此外,在信息化背景下,受试者的随访、数据采集、药物配送、生物标本采集与运输等都可能通过远程化方式执行,使操作更为便利。但缺少与受试者的当面沟通可能影响其依从性,需要额外加以注意。可考虑通过提供日记卡或可穿戴设备,以及定期联系(通过电话、电子邮件等方式)受试者了解试验情况等方法,提高受试者的依从性。
临床试验的信息化建设属于新兴领域,为临床试验带来了新的研究方式。试验设计、获得伦理委员会批准、受试者招募、受试者知情同意、研究数据采集、受试者访视、数据监查、重点指标测量、不良反应报告、统计分析等各环节都可通过数字化、远程化、智能化方式开展,但也面临诸多挑战。基本原则是尽早与监管机构及伦理委员会沟通,咨询并征求其意见和建议。在合规的前提下,组建多元化的研究团队,包括临床专家、方法学专家、伦理专家、数据管理分析专家、网络安全专家、工程师等,不断探索完善,稳步推进实施,以满足监管与注册要求。
8 数据安全的伦理问题
临床试验采集的受试者相关研究数据,可包括健康状况数据、医疗应用数据、医疗支付数据、临床研究病例数据和生物组学数据等个人属性数据。随着时代的发展进步,研究中受试者的隐私,个人信息及数据安全等问题日益受到了广泛关注。受试者隐私或个人信息的泄露可能造成其社会污名化或歧视,进而造成精神性和社会适应性的伤害。我国法律规定,受试者的个人信息和个人隐私受法律保护。涉及人类遗传资源相关信息属于国家秘密的,还需依规实施保密管理。开展数据处理活动,需履行数据安全保护义务。如发生信息泄露,研究者将承担相应的法律责任[28-36]。为此,开展临床试验必须对研究数据的收集、存储、使用、加工、传输、提供和公开等各项活动采取切实可行的必要措施,保护个人信息及个人隐私信息,保证数据的安全性[37]。
8.1 尊重受试者的知情权
研究者有义务为潜在的受试者提供充分的信息,从而让受试者自由选择是否参加研究。无论是用于特定的研究项目,还是目前尚无特定目的的未来研究,均需获得受试者的知情同意。研究者还应保证允许受试者在试验过程中无条件撤回授权以满足知情的选择退出程序[33]。对于目前尚无特定目的的未来研究,可采用广泛知情同意的方式。伦理接受广泛知情同意的前提是有合宜的研究管理,且研究目的明确后,需再次经伦理审查批准方可开展研究[28-29,36,38]。
遗传数据难以做到完全匿名化,理论上可把个人数据与有遗传信息和标识符的生物学样本联系起来,因此对于遗传数据应有更多的保护措施[29]。按规定,对于涉及采集我国人类遗传资源的研究,需事先告知受试者并获得其书面知情同意[30]。如需利用临床/研究剩余标本或者遗传数据进行其他目的的研究,则必须经伦理委员会审查批准并再次获得受试者同意[29,35]。
研究者必须全面、真实和准确地告知受试者试验过程中与所收集数据相关的内容,并确保数据的使用不超过知情同意告知的范围。告知内容包括:数据收集的目的、收集方法、数据储存、数据处理(如匿名化或去标识化处理)、数据使用范围、数据保管、研究数据的保密范围和措施、可能的数据泄露风险,并且应告知受试者有自愿参与和随时无条件退出的权力,以及研究过程中可撤回其数据以及如何撤回。此外,还需告知以下内容:是否告知研究目的以外的研究发现,以及相应的实施方式;数据分析结果可能与个人信息的哪些来源相关联;什么类型的研究需要获得受试者的再次同意才能实施;谁将从研究中受益;向受试者通报研究结果的机制;如何确保受试者的权益不受损害等[28-29,35,39]。
8.2 保证数据安全的措施
尽管临床试验结束时可将数据匿名化,但研究过程中仍然存在有身份标识的个人信息被泄露的风险。在设计临床试验时,研究者必须针对个人信息及数据安全采取措施,确保数据处于有效保护和合法利用的状态,并具备保障持续安全状态的能力。具体措施可考虑但不限于以下方面[8,36-40]:
① 建立数据保密制度:数据保密是临床试验过程中必须遵守的基本原则,研究机构应设定程序保证研究数据的保密性,建立及签署保密协议以规范相应人员的行为,建立保密系统防止数据库的泄密。
② 分权限管理数据:对数据控制者及数据使用者执行功能和数据访问分权限管理,并限制第三方对数据的使用权限。
③ 去标识化:在不影响数据完整性的条件下,对敏感的个人属性信息进行处理,针对可唯一识别到个人或披露后会给个人造成重大影响的信息,应去除个人属性信息;针对可间接关联到个人的信息,宜进行泛化、转化等处理,例如数据匿名化或去标识化。去标识化所使用的代码,应严格保密,原则上代码索引仅由开展研究的医疗机构保存,企业不能获得未去标识化的数据。
④ 数据加密处理:对数据进行加密处理,保证数据存储,传输的保密性和完整性,加密数据和密钥应分别存储。
⑤ 控制数据使用数量:仅使用所需的最小数据集。
⑥ 有数据修改的过程管理:确保数据管理过程可溯源,研究者对数据进行修改需要签名,中间过程数据需保存,不得覆盖原有过程记录。
⑦ 制定数据备份集恢复策略:定期对数据进行备份,建立介质存取、验证和转存管理制度。
⑧ 数据核查:建立数据核查机制。在不违反保密原则和相关法规的前提下,监查员、稽查员、伦理委员会和药品监督管理部门检查人员可查阅受试者的原始医学记录,以核实临床试验的过程和数据。
⑨ 数据发布和共享:发布临床试验结果时受试者的身份信息应保密。去标识化后的数据可在研究者之间自由共享。
9 结语
临床试验是医药创新和改善诊疗过程中不可或缺的环节。科学的设计和实施是确保临床试验获得可靠结论的基石。期待我国广大临床试验研究者和相关从业人员不断提升能力,开展更多高质量的临床试验,为打造具备国际竞争力的创新医药生态系统提供有力支持,为临床决策提供更多科学证据。
《药物临床试验设计与实施中疑难问题处理的专家共识》专家名单
执笔:李济宾(中山大学肿瘤防治中心),王书航(中国医学科学院肿瘤医院),李婧(中国医学科学院皮肤病医院),张丽华(中国医学科学院阜外医院),冯芳(中国医学科学院阜外医院),李静(中国医学科学院阜外医院)
专家共识写作组(按姓氏拼音排序):
白桦(中国医学科学院北京协和医院),曹国英(复旦大学附属华山医院),曹玉(青岛大学附属医院),陈懋(福建省立医院),车宇航(中国医学科学院整形医院),董志强(内蒙古科技大学包头医学院第一附属医院),冯芳(中国医学科学院阜外医院),郭彩霞(首都医科大学附属北京同仁医院),宦静(中国医学科学院皮肤病医院),姜敏(江西省人民医院),蒋发烨(广东省人民医院),李海燕(北京大学第三医院),李静(中国医学科学院阜外医院),李婧(中国医学科学院皮肤病医院),李济宾(中山大学肿瘤防治中心),李卫(中国医学科学院阜外医院),李雪宁(复旦大学附属中山医院),李卓(中南大学湘雅二医院),林阳(首都医科大学附属北京安贞医院),刘珏(武汉市中心医院),刘利军(中国医学科学院血液病医院),刘中国(山西医科大学第一医院),阮邹荣(浙江大学医学院附属第二医院),商朴(中国医学科学院阜外医院),孙明媛(中国医学科学院血液病医院),唐蕾(中山大学附属第一医院),王白璐(山东大学齐鲁医院),王彩娥(河南科技大学第一附属医院),王焕玲(中国医学科学院北京协和医院),王清(中日友好医院),王书航(中国医学科学院肿瘤医院),王淑梅(河北医科大学第二医院),王婷(兰州大学第一医院),王晓霞(山西医科大学第二医院),王欣(北京医院),向瑾(四川大学华西医院),徐懿萍(上海交通大学附属瑞金医院),阳国平(中南大学湘雅三医院),岳熠(中国医学科学院血液病医院),邹燕琴(中山大学孙逸仙纪念医院),张海波(中国医学科学院阜外医院),张庆瑜(天津医科大学总医院),郑姣(湖南省人民医院),张丽华(中国医学科学院阜外医院),郑昕(中国医学科学院阜外医院)
利益冲突:所有作者均声明不存在利益冲突。
1 前言
临床试验是科学评价药物疗效和安全性最可靠的方法,为药物上市和临床循证决策提供坚实的科学依据,是医药创新产业中最为关键且投资最多的环节。近年来,随着鼓励医药创新产业发展政策的出台,我国自主医药的创新产业取得了快速发展,并且已开始走向国际市场。国家药品监督管理局也发布了一系列技术指导原则,旨在提升临床试验能力,规范临床试验活动。与此同时,面对临床试验费用、时间成本日益高昂的现状,优化临床试验的设计和实施过程,完善监管和质控措施,在保证结果可靠的前提下,提高试验的成本效益,是当下亟待解决的主要难题。此外,伦理批准是临床试验实施的前提条件,数据安全和相关的医学伦理问题日益受到重视。
为进一步提高我国研究人员开展临床试验的能力,针对临床试验关键环节的普遍疑问和模糊认识,国家心血管病中心、中国医学科学院阜外医院国家心血管疾病临床医学研究中心组织临床试验方法学、临床试验监管、心血管病学和肿瘤病学等领域专家共同制定此共识,涵盖受试者入选、受试者保留、研究终点选择、研究质量控制、信息技术应用和数据安全伦理等方面,旨在为广大临床试验研究者提供参考和指导。
2 提升受试者的多样性
受试者入选是临床试验正式开始的重要标志之一,如何尽可能纳入更广泛多样的获益群体,保证入选的受试者充分代表上市后的使用人群,是临床试验设计中的一个重要问题。临床试验往往被认为会排除或较少入选某些特定亚组人群,例如高龄、合并肝肾功能不全或女性等,因而难以获得候选药物在这些特定人群中的疗效评价证据。提升受试者的多样性,纳入更为广泛的适应证人群,有助于更好地评估候选药物在特定亚组人群中的疗效和安全性。美国食品药品监督管理局于2020年11月发布了“改善临床试验人群的多样性—入选标准、招募措施和试验设计的行业指南”[1],该指南提倡临床试验申请人扩大受试者的合格标准,避免不必要地将特定亚组人群排除在外。我国目前尚没有针对如何提升受试者多样性的指导原则。本共识将从受试者入选标准的制定、受试者相关因素和监管机构因素3个方面进行阐述,为提升受试者多样性提供建议举措,以期为我国的临床试验研究者提供参考指导。
2.1 适当拓宽入选标准,避免不必要的排除标准
在制定入选标准时,研究者应考虑临床实践中可能使用该药物的患者的多样性,包括年龄、性别等特征,适当扩大入选标准可在一定程度上提高临床试验结果的可推广性[1],也可考虑采用适应性设计(adaptive design,详见本文“5适应性设计及其应用”),在获得更多安全性数据后,扩展到更大人群范围[2]。证据充分时,确证性临床试验不必限于成人人群,可考虑同时纳入儿童和青少年,甚至妊娠妇女。
在制定排除标准时,在确保受试者的安全和实现研究目标的前提下,应评估每条标准是否都确有必要,并剔除或修改非必要的排除标准,例如器官功能障碍较轻但可耐受试验药物,且有较大可能从试验中获益的受试者人群。通过早期临床试验[1],分析不同受试者人群的药物代谢特征,例如老年人和肝肾功能障碍者,能够为后期临床试验中是否有必要排除某些受试者提供客观依据,也可为不同受试者人群中的剂量优化方案提供参考依据。
对于某些临床试验类型,放宽入选标准十分重要。在富集(enrichment)适应性设计的临床试验中(详见本文“适应性设计的主要类型和注意事项”),应尽可能设定更为广泛的入选标准,避免排除某些特定的受试者人群。富集是指前瞻性地使用特定的临床或生物学特征筛选受试者人群,使得在该人群中检测到药物效应(如果确实存在药物效应)的可能性比未选择人群中更大。合理地放宽入选标准能够从更广泛人群中筛选出更多潜在的获益群体。此外,由于受试者数量十分有限,对于罕见病的临床试验,避免入选标准过严,保证受试者最大限度地参与亦十分重要。在很有限的情况下,如果不存在非预期安全性问题,且早期试验用药并不改变疾病进程,可考虑将已参加过早期安全性试验的受试者再次纳入到疗效性探索或确证性试验中[1]。
2.2 受试者相关因素
研究者应考虑采取包容性的入选措施,帮助易被忽视和较少被纳入的亚组人群参加临床试验。可与社区、患者权益组织等建立联系,获得其协助,以更好地理解潜在受试者的需求,从而有针对性地调整入选措施[3]。在研究中心的选择上,可考虑少数族裔或少数民族等聚居区附近的医院[4]。在工作人员的选择上,考虑不同的文化背景和语言差异,招募多元文化背景的工作人员帮助有语言沟通障碍的受试者参加。
在运行过程中,研究者可考虑采取措施减轻受试者负担,从而让更多受试者愿意参与临床试验,在一定程度上有助于改善受试者的多样性[5]。例如调整随访间隔时间或时间窗,或采取电话、邮件或视频等方式来替代面对面访视,特殊情况也可考虑由研究人员去受试者家中访视。对于罕见病患者,由于地理分布上较分散,疾病本身也可能不同程度地影响其出行,研究人员需要付出更多努力保证受试者的入选。也可考虑在试验结束后进行开放标签,使安慰剂组患者也能获得活性研究药物,从而鼓励更多受试者参加临床试验。
2.3 监管机构相关因素
监管机构的指南或政策文件,有助于引导研究者或申办者在临床试验设计和实施时提高临床试验入选人群的多样性,充分考虑各国人群和候选药物潜在适用人群的年龄、性别、种族等特征,提前制定好计划,招募具有不同人口学特征的受试者,尤其是常常被忽视和较少纳入的一些亚组人群,如少数族裔和老年人群等。要求使用统一的人口学变量格式和定义,便于对不同研究的数据进行汇总分析,也便于对不同研究的结果进行比较。此外,监管机构要求报告不同人口学特征亚组人群的疗效和安全性结果,可更全面地反映候选药物的疗效和安全性[6]。
此外,监管机构还可设置专门的促进受试者多样性的部门,采取多种措施,如制作临床试验科普材料、通过多媒体宣传临床试验参与的重要性等,提高广大人群对临床试验的认识,帮助被忽视的群体参与临床试验[5,7]。
综上所述,适当拓宽入选标准、采取更具包容性的入组措施和一些监管措施,能够提高受试者对药物适用目标人群的代表性,帮助医生了解药物针对更大范围人群的安全性和有效性,使更多群体获益。
3 受试者失访与剔除
在临床试验的实施过程中,难免会出现受试者的失访、违背纳入与排除标准和依从性差等问题。失访率高或不恰当地处理相关数据都会严重影响试验结果的可靠性。研究者必须考虑在设计和实施阶段采取措施减少受试者的失访,并谨慎处理失访者的数据。对于很多研究者而言,这些问题仍然是较大的挑战。在面对违背纳入排除标准、违背方案合并用药、错误分组、依从性差等情况时,如何进行受试者剔除(excluding patients from analysis)也是较为棘手的问题。
3.1 失访处理
失访(loss to follow- up)是指受试者在临床试验过程中由于各种原因没有按预定方案完成随访,研究者未能获得其随访数据,属于脱落(drop out)的一种情况。随着脱落率升高,试验结果的准确性下降。
如前所述(本文“受试者相关因素”),研究者应该在设计阶段考虑受试者参加临床试验可能存在的困难,采取合理措施,以减少失访的风险。常见的失访原因包括受试者搬迁、失去联系、发生药物不良反应等。受试者失去联系是导致失访的常见原因之一。在发生失访时,研究者应该采取补救措施尽可能获得随访数据。为避免受试者失去联系,签署知情同意书时,在征得受试者及其家属同意的情况下,应尽可能留下多个受试者亲属(特别是不与受试者同住的亲属)的联系方式。当受试者搬迁时,可通过上门访问等方法尽最大可能获得随访数据。对于因药物不良反应导致的失访,应尽可能与受试者及其家属取得联系。一方面,需要详细收集记录不良反应的程度和分类、与试验药物的相关性、起止时间和转归,并按照研究方案、医疗规范及时妥善处理;另一方面,应取得受试者及家属理解,受试者发生不良反应而无法耐受治疗时可停止研究治疗,但仍需按照研究方案的要求完成完整随访。
常用缺失值处理方法有:末次观测值结转、基线观测值结转、均值填补、回归填补、多重填补、最差值填补及临界点法。对于失访造成的主要疗效指标的缺失,应将方案和统计分析计划中事先规定的数据填补方法作为主分析方法进行处理[8,9],并将上述其余填补方法作为敏感性分析方法。如果敏感性分析结果与主分析结果一致,说明结果可靠。一般来说,缺失数据的处理方法应遵循保守疗效估计的原则。
3.2 受试者剔除
在临床试验中,可能发生违反纳入排除标准、违反方案规定的合并用药、交叉治疗、依从性差等情况,不能简单予以剔除。应遵循方案中事先规定的受试者剔除原则,确定统计分析数据集。受试者剔除标准需要在试验数据库锁定之前制定。对于剔除的每一位受试者,都需要给出详细的理由。定义分析数据集时遵循2个原则[9]:① 尽可能减少偏倚;② 防止增加Ⅰ类错误概率。一般情况下,对于优效试验,意向性治疗(intention-to-treat,ITT)是数据分析的基本原则,要求将所有随机化的受试者按照随机分配的组别进行分析,不考虑受试者实际接受了何种治疗,也不考虑是否违背方案或失访。遵循ITT原则对疗效的估计是最保守的,要求对所有随机化受试者完成随访以获得研究结局。这在实践中有时难以达到,只能获得尽可能接近符合意向性治疗原则的理想受试者集—全分析集(full analysis set,FAS)。FAS仅在非常有限的情况下才可剔除已经随机化的受试者,通常包括:违反重要入选标准、受试者未接受试验用药物的治疗、随机化后无任何观测数据等。需要强调的是,剔除每一位受试者都需要对剔除的合理性进行充分论证,并事先说明。其他常用的分析数据集还包括符合方案集(per protocol set,PPS)和安全性分析集(safety set,SS)等。PPS纳入的受试者需要有较好的方案依从性,需要完成事先设定的试验药物的最小暴露剂量,主要指标的数据均可获得,且没有重大违背试验方案。随机化后至少接受一次治疗且有安全性评价数据的受试者均应纳入SS。
对每一位从统计分析数据集中排除的受试者,都应该在盲态审核时阐明理由,并在揭盲之前以文件形式写明。根据不同的研究目的,需要在临床研究方案和统计分析计划中明确描述3个数据集的定义,同时明确定义违背方案、脱落或缺失数据的处理方法。在优效试验中,应采用ITT/FAS作为主要分析数据集;在等效或非劣效试验中,如果试验质量欠佳,发生较多失访、退出、替代治疗或组间交叉等问题,可能会缩小组间疗效差异,此时采用ITT/FAS容易得出假阴性结论,需要同时采用ITT/FAS和PPS分析。两个数据集结论一致时可增加试验结果的可信度。如果结论不一致,可能存在偏倚,应分析并合理解释出现不一致的原因。
3.3 在设计阶段提高受试者依从性,减少失访和受试者剔除
出现失访或需要将受试者从统计分析数据集中剔除,都是比较被动的局面,更为明智的做法是,从研究设计阶段即充分考虑受试者依从性和研究质量问题,制定合适的措施提高受试者的依从性,例如:① 在随机之前排除可能搬迁或不依从的受试者;② 尽量使干预措施简单且易于实施;③ 采用易于测量的指标,提高依从性;④ 设计合理的随访频次。此外,在研究实施过程中,研究者与受试者应建立良好的人际关系,研究者应始终关注受试者,及时处理实施过程中发现的问题。通过科学严谨的设计、规范高效的实施,尽可能降低受试者的失访率,提高随访质量,将尽可能多的受试者纳入统计分析数据集,获得真实准确可靠的临床试验结果。
4 研究终点和多终点设计
研究终点是评价药物疗效的关键指标,设定多个研究终点在临床试验并不少见。对于Ⅰ/Ⅱ期临床试验,多终点十分常见,但是由于是探索性研究,样本量估计时可不考虑对Ⅰ/Ⅱ类错误的控制。对于Ⅲ期确证性研究,双终点和多终点的应用亦较常见,能够增加试验效率[10-11],但须注意遵循相应的原则。下面将重点介绍临床试验研究终点的定义、分类和选择原则,并以抗肿瘤新药临床试验为例,阐述临床试验多终点的设计考量要点。
4.1 临床试验的研究终点
4.1.1 定义
研究终点是可通过客观测量并辅助研究者决定是否接受或拒绝无效假设(两种治疗方法或策略之间在研究终点上没有统计学意义的显著差异,H0)的一个重要指标;在特定时限内的临床试验中,研究终点是指对临床结局的观测与评价,包括生存期、生活质量/临床症状等。
4.1.2 分类
基于临床获益的价值,可分为:① 临床终点(clinical endpoint),直接代表最重要的临床获益,即延长生存,改善症状和生活质量,主要用于常规批准新药上市(traditional approval,TA)。② 替代终点(surrogate endpoint),可用于加速批准(accelerated approval,AA),包括两大类,一是间接代表临床获益且经过验证与临床终点相关的替代终点,二是未经验证但很可能预测临床获益的替代终点。
基于需回答的研究问题的重要性,可分为:① 主要终点(primary endpoint):是指与临床试验所关注的主要问题(主要研究目的)直接相关的,能够提供最具临床意义和令人信服证据的研究终点,样本量计算和评价试验是否达到主要目的都是基于主要终点。② 次要终点(secondary endpoint):一般为多个,可包括关键次要终点(与主要终点共同纳入Ⅰ类错误控制,用于支持药物说明书声称的获益)。③ 探索性研究终点:一般与药物疗效预测标志物或者试验药物引起的机体变化有关。
基于依据来源,以抗肿瘤药物临床试验的研究终点为例,可分为:① 生存相关研究终点。描述死亡事件的终点:如OS(overall survival,总生存,从治疗开始或随机至死亡的时间)和OS率(特定时间段内生存患者占试验刚开始时总患者数的比例)等。基于肿瘤测量的终点:包括ORR(objective response rate,客观缓解率,治疗后达到完全缓解或者部分缓解的受试者占试验刚开始时总患者数的比例),DCR(disease control rate,疾病控制率,治疗后达到完全缓解或部分缓解及疾病稳定的受试者占试验刚开始时总患者数的比例),DoR(duration of response,疗效持续时间,治疗后达到完全缓解或部分缓解的患者,从首次评估有效到疾病进展或死亡时间),PFS(progression free survival,无进展生存,从治疗开始或随机入组至疾病进展或死亡的时间),DFS(disease free survival,无复发生存,从随机入组到疾病复发或任何原因导致死亡的时间),EFS(event free survival,无事件生存,从随机入组到疾病复发或任何原因导致死亡的时间)等。如以肿瘤测量相关研究终点为唯一疗效指标,药物上市批准前可能需要评价临床终点如OS的临床试验验证。② 生活质量相关研究终点:主要为症状评估终点,包括症状减轻或缓解时间、生活质量(quality of life,QoL)和癌症症状进展时间(time to progression of cancer symptoms,TTP)和患者报告结果(patient report outcome,PRO,即直接来自于患者对自身健康状况、功能状态及治疗感受的报告,不包括医护人员及其他任何人员的说明)。需要注意的是,包含生活质量的复合症状终点中的不同症状指标应具有相似的临床重要性,其临床获益不仅归因于单个指标的改善,对此类复合症状终点进行分析时应包含对具体单个指标的分析[12]。
4.1.3 临床终点的选择
① 必要条件:具有临床意义且与疾病过程相关,例如PFS是用于评估药物能否延迟疾病进展;能够回答试验的主要问题,例如DFS是用于评估治疗是否延迟复发);终点事件发生频率足够高,使研究具有足够的统计能力,例如OS适用于生存期短的人群,心血管疾病的临床试验通常选择主要不良心血管事件(major adverse cardiac event,MACE)、心血管死亡或者全因死亡等硬终点指标。② 评估优化:若结果存在偏倚或不确定性,需要通过统计学方法优化;需考虑是否计划加速审批,如ORR、PFS等终点均有可能支持加速审批。③ 如计划在一个研究中回答多个临床问题,应考虑选择多终点。
4.2 临床试验多终点
临床试验多终点是指一项研究中同时设置可能代表试验药物临床获益的多个指标作为研究终点。临床试验多终点会产生多重性问题(multiplicity issues),即在一项完整的临床研究中,需要经过不只一次的统计推断(多重检验)得出研究结论的相关问题[13]。常用的临床试验多终点包括以下3类:① 共同主要终点(co-primary endpoint):要求2个或以上不同的主要终点均有统计学显著意义时才认为研究药物具有疗效。② 多终点(multiple endpoint):评估几个主要终点,其中至少一个具有治疗效果就能确定临床获益。③ 复合终点(composite endpoint):将多个临床相关结局合并为一个单一变量,抗肿瘤药物的临床试验中常用PFS、DFS、EFS等复合终点;心血管疾病的临床试验中常用MACE作为复合终点。
临床试验多终点的使用场景及统计分析注意事项。确证性临床试验中:单一主要终点较为常见,但某些情况下会涉及多个主要终点,包括共同主要终点和多终点两类,前者要求多个主要终点均具有统计学意义,后者则是多个主要终点中至少一个有统计学意义就认为研究药物有效。二者在进行方案的统计学设计时需要注意Ⅰ类错误和Ⅱ类错误膨胀问题。① 共同主要终点:会增大Ⅱ类错误发生率,从而降低检验效能。检验效能降低的程度与主要终点的个数和主要终点之间的相关性有关,个数越多、相关性越弱,检验效能降低的幅度越大。② 多终点:会增加Ⅰ类错误发生率,需要采取适当的策略和方法控制总的Ⅰ类错误率(family-wise error rate,FWER),如进行多重性调整。可通过统计学方法的α分配和/或α传递来管理Ⅰ类错误,如:平行策略(Bonferroni法、前瞻性α分配法),序贯策略(Holm法、Hochberg法、固定顺序法、回退法),分阶段的整体决策策略(较经典的α分割方法有Pocock法、O’Brien-Fleming法和Haybittle-Peto法)等[10,14]。在非确证性临床试验中:主要终点为多个的情况较常见,不需要统计学假设,不需考虑Ⅰ类和Ⅱ类错误的膨胀问题。
4.3 临床试验多终点的选择
临床试验多终点在抗肿瘤新药研发领域更为多见,因而以此为例说明多终点选择需要考量的要点。首先,最常见的抗肿瘤新药确证性研究的多终点选择为PFS和OS,如果设定共同主要终点,PFS和OS终点必须同时达到,临床试验的样本量估算按照OS的统计学假设来计算;部分研究设计以PFS和OS作为多终点,两个终点达到其一即为研究成功,需要进行多重性调整,可通过分配或者传递α值来减少Ⅰ类错误。
目前抗肿瘤新药临床试验常用到篮式设计(一种疾病多个药物)、伞式设计(同种药物多个疾病)和平台设计(多种药物、多个疾病)等复杂设计方案,如果子研究是独立研究,且回答各自的临床问题,比如针对不同的肿瘤或者目标人群等,则无需进行多重性调整。
在临床试验方案和统计分析计划中,应事先明确多重性问题和多重性调整的策略和方法,并鼓励在设计阶段与监管机构充分沟通。同时,若在临床试验过程中进行调整,亦应与监管机构及时沟通。
5 适应性设计及其应用
随着创新药物尤其是抗肿瘤新药的不断涌现,临床试验设计的要求不断提高,尤其是很多新靶点的制剂或免疫制剂具有独特的药理特点,例如剂量-反应关系不唯一、延迟毒性和延迟有效性等,为探索药物的安全性和有效性带来了巨大挑战。与此同时,Ⅰ期、Ⅱ期和Ⅲ期临床试验的边界越来越模糊,创新试验模式往往提倡各阶段的融合,以提高数据利用度并加快药物的研发进程。
适应性设计是一类创新性的临床试验设计,是指按照预先设定的计划,在期中分析时使用试验期间累计的数据对试验设计的一个或多个方面做出相应修改的临床试验设计,修改的内容和目的包括:修正初始设计的偏差,提高研究的统计学效能,使试验更加符合伦理学要求;增加研究的外推性和可解释性,提高试验效率,降低时间和成本投入[2,15]。
近年来,临床试验研究者、药物研发企业和监督管理机构对适应性设计的临床试验给予极大关注,各国政府监管机构陆续出台适应性设计的相关指导原则,例如美国食品药品监督管理局于2019年发布了《药物和生物制品临床试验适应性设计行业指南》,我国国家药品监督管理局亦于2021年发布了《药物临床试验适应性设计指导原则(试行)》。尽管如此,很多研究者对适应性设计的应用原则、范围和注意事项仍缺少充分地了解和认识,本共识将主要针对上述问题进行阐述。
5.1 适应性设计的原则
适应性设计既可用于探索性临床试验,亦可用于确证性临床试验。在选择使用适应性临床试验之前,需要考虑以下4项基本的应用原则:① 在期中分析阶段进行的方案修改需要在原始方案中预先设定,而非临时提出,原始方案中应该明确说明期中分析的时间、次数、适应性设计的类型、所使用的统计方法及期中分析目的等;② 严格和充分控制Ⅰ类错误在合理水平(例如,双侧检验水平为0.05);③ 选择准确的效应估计方法,减少偏倚的引入,确保结果的可靠;④ 避免期中分析的结果泄露从而影响研究后续操作和受试者入组,保证临床试验的完整性。期中分析或方案调整应由独立的数据监察委员会(independent data monitoring committee,IDMC)执行,以保证申办方和研究者处于盲态。有关IDMC的更多内容,可参阅《药物临床试验的生物统计学指导原则》等。
5.2 适应性设计的主要类型和注意事项
适应性设计可体现在研究设计的多个环节,下面简述不同的适应性设计类型及其需要注意的问题:
① 成组序贯设计(adaptive group sequential design):预先计划在试验中进行一次或者多次期中分析(interim analysis),根据每次期中分析的结果做出后续的试验决策。期中分析的时间点一般基于累计数据的占比(如受试者入组比例或发生目标事件数的比例等),期中分析的次数、时间点及I类错误调整方法需要在试验方案中给予明确规定,在试验实施过程中严格按照方案执行,不可随意进行计划外的期中分析,以确保整个试验的科学性和完整性。如果存在以优效性提前终止试验的可能,选择时间点时应考虑期中分析时的信息量是否可提供足够的检验效能。
② 样本量再估计(sample size re-estimation):根据预先设定的期中分析,利用累计的试验数据重新估算样本量,以保证在可容许的Ⅰ类错误概率范围内达到预先设定的目标。同时需要注意:如果重新估算得到的样本量比原样本量大,那么接下来的研究中采用新样本量;否则仍使用最初估计的样本量。
③ Ⅰ/Ⅱ期或者Ⅱ/Ⅲ期无缝设计(phase Ⅰ/Ⅱ,Ⅱ/Ⅲ two stage seamless design):无缝设计是将传统的两个独立的临床试验阶段,整合为一个试验的2个阶段,将前一阶段临床试验结束时的分析作为期中分析,并据此进行后期试验的设计或者剂量选择。无缝设计可缩短临床试验周期,在保证一定的检验功效的前提下,使用相对较少的样本量达到两期试验的目的。其中,Ⅱ期试验结果会影响后续Ⅲ期试验的Ⅱ/Ⅲ期无缝设计,需要在研究设计中事先设定自适应相关内容,使最终分析可使用Ⅱ/Ⅲ期研究中的全部数据,尤其需要控制试验的总体Ⅰ类错误率,应使用适当的统计学方法来防止Ⅰ类错误膨胀,常用的有Fisher组合检验法及序贯设计方法等。
④ 适应性富集设计(adaptive enrichment):根据试验的前期结果分析哪些对象最可能获益,在后续试验中增加其入组比例,从而达到放大治疗效果、避免更多受试者暴露于可能的毒副作用的目的,同时也提高了试验效率。例如根据研究适应证不同,使用实践经验、病理学特征、基因组学特征或者其他研究经验等方法来确定受试者类型等。例如基于标记物的最优序贯富集设计(optimal sequential enrichment design,OSED),首先对阳性生物标记物亚组进行两阶段设计,在确定药物对阳性生物标记物亚组有效之后,对阴性标记物亚组进行两阶段设计,该设计的期中决策准则是通过最大化一个特定的效用函数,并同时控制Ⅰ和Ⅱ类错误而得到。
⑤ 适应性主方案试验设计(master protocol with adaptive design):指方案中包含多个子方案,如篮式设计(一种疾病多个药物)、伞式设计(同种药物多个疾病)、平台设计(多种药物,多个疾病)等。在篮式设计的临床试验中,评估药效的两种常用方法是汇集分析和独立分析。汇集分析有助于提高统计检验功效,但当试验药物在不同的篮子中的疗效有差异时,该方法将导致严重的估计偏倚和Ⅰ类错误率膨胀。而独立分析仅使用每个篮子的数据独立评估试验药物在此篮子中的疗效,在篮子之间并不进行任何信息借用,因此避免了估计偏倚和Ⅰ类错误膨胀问题,但由于每个篮子的样本量有限,往往缺乏足够的检验效能。考虑到不同篮子间异质性,可利用试验中观测到的数据自适应地在篮子之间借用信息,包括:两阶段篮子设计、贝叶斯分层模型篮子设计、校准贝叶斯分层模型的篮子设计及潜在亚组篮子设计等。平台研究的适应性设计方法主要有MIDAS(multi-candidate iterative design with adaptive selection)贝叶斯Ⅱ期临床试验设计方法,允许以高效、无缝的方式持续筛选大量候选药物,只需要一个主方案和一个对照组,有利于简化试验过程,降低新药研发成本。
⑥ 适应性标志物设计(biomarker-adaptive design):根据临床试验进行过程中探索的分子标志物进行后续临床试验入组人群筛选的设计。常用的设计方法有标志物策略设计(marker-strategy design,MSD),是用于识别和验证预测标志物的设计。还有标志物分层设计(marker-stratified design,MSTD)是根据标志物阳性或阴性对受试者进行分层,然后在每一层内将受试者随机分配到对照组或试验组进行治疗。其他还有最优标志物自适应设计等。
⑦ 适应性剂量递增(adaptive dose escalation):在I期试验中根据前期爬坡剂量的结果进行后续剂量选择的方法,主要用于确定试验药物的最大耐受剂量和剂量限制性毒性,常用的设计方法包括贝叶斯基于算法的Rolling6设计,基于模型的TITE-CRM设计、DA-CRM设计、TITE-BOIN设计、TITE-Keyboard设计、Simon两阶段设计等。
⑧ 多重适应性设计(multiple adaptive design):一个试验中采用大于一种适应性方法的方案设计,此时应注意控制概率Ⅰ类错误。
其他适应性设计的方法还包括:适应性治疗转换(adaptive treatment-switching),无效药物剔除设计(drop-the-loser design),假设性自适应设计(adaptive-hypothesis design),多臂多阶段(multi-arm multi-stage)设计等。
5.3 其他考量
设计适应性临床试验需要结合实际情况考虑下列问题。首先,原则上一般不允许在试验进行过程中进行非预设的变更,但在临床试验的操作实践中,基于试验过程中产生的数据提示需要进行非预先设定的修改时,应经过谨慎考虑后,在保证不破坏合理性、完整性和可行性的前提下做出修改,并需要提前与监管机构进行沟通确认。第二,适应性设计通常会与先进的统计学方法和科学技术相结合,例如贝叶斯方法、新颖替代终点指标及模拟技术等,操作更复杂,通常需要更高的临床试验实施质量保驾护航。研究者需要充分考虑获取的信息量、受试者招募速度、研究者的理解程度和时间成本等因素,如果适应性设计获取的信息少于传统设计,则可能导致入选进度变慢、纳入的受试者特征发生改变、或因试验设计过于复杂,导致研究质量受到严重影响,此时选择适应性试验设计应该谨慎。
此外,要注意的是,基于外部数据对进行中的临床试验做出的修改通常不属于适应性设计,例如同一类药物刚完成的试验显示某主要终点的选择不合适,或新发布的相应指南对主要终点另有定义,需要修改主要终点;新的标准治疗的改变,需要修改标准治疗的对照组,或因无法继续入组患者而需要提前终止试验等。
总之,适应性设计由于其灵活的特点,能够节约研发成本和投入时间,在某些情况下也更加符合伦理要求,因而相关的研究应用日趋广泛,但是适应性设计较传统临床试验更为复杂,对研究运行质量的要求更高,且无法弥补试验中已经存在的缺陷,因此在设计、实施和管理中要更为谨慎。
6 大规模试验应采用简单易行的运行和质控方式
在心血管疾病等慢病领域,评价药物对重要临床结局的影响往往需要开展大规模的临床试验反复验证,入选超过数千例受试者,随访数年[16-17]。大规模是结论可靠的重要保障,唯有采用简单易行的操作方式,才能实现[18]。大规模与小规模临床试验存在的质量风险不尽相同,应结合其特点采用针对性的运行管理方法与质控措施。首先,大规模临床试验应采用易于确定且重要的临床终点,例如死亡、心肌梗死等,其作为客观指标判断依据明确,基于受试者的报告很少会发生遗漏。其次,由临床事件委员会(clinical event committee,CEC)按照统一的标准对可能的终点事件进行中心性判定,误判的可能性会降到最低。再次,试验采用双盲设计,且样本量足够大,个别受试者数据记录的偏差并不会影响研究结论。相反,如果操作过于复杂,研究规模不足,可能对研究结论造成致命性影响。简单易行意味着在设计和运行方面简单易行,紧抓决定临床试验质量的关键环节,避免让非必需内容徒增成本和复杂性。因此,简单易行的方式不是牺牲研究质量,而是为更好地保障研究结论的科学性。
近20年来,全球临床试验的领军机构之一英国牛津大学在SHARP[19]、HPS-THRIVE[20]、REVEAL[21]和EMPA-KIDNEY等一系列国际多中心大规模药物临床试验中发展了简单易行(streamlining)的运行质控方式,并不断完善,已得到美国食品药品监督管理局等国际权威机构的认可,代表了未来临床试验方法学的重要趋势。鉴于此,我们对简单易行的质控运行方式的核心环节进行简介。
6.1 研究数据采集
完善的电子数据采集系统(electronic data capture,EDC)是大规模临床试验以简单易行方式运行的重要基础。EDC系统应界面友好,只采集必要的数据,研究数据主要来自于详细且结构化的受试者访视,以及本地和中心实验室结果,不使用纸质的病例报告表(case report form,CRF)。在大规模的临床试验中,受试者是最直接的数据来源,因为其能够报告所有的医学情况,也包括不良事件(adverse event,AE)和终点事件。在长达数年的随访中,受试者可能在不同的医院接受诊疗,研究者仅依靠本院的病历系统未必能完全了解受试者的所有就医信息,所以只有受试者能够提供本人最新的健康和用药信息。在每次随访时,研究者收集受试者的所有住院和任何其他不良事件的详细信息,并特别询问因药物导致的严重不良事件。研究者直接将来自于受试者报告的信息/数据录入到EDC中(对于难以从受试者本人处获得的信息/数据,也可从亲属或者其他医生处获得)。此外,针对任何不可信或不一致的数值或回答,电子系统中将自动弹出消息予以警示,解决该问题后数据才能保存。这些措施有助于确保数据的质量。
基于前面所述的理由,即使受试者忘记而漏报少量的事件也不会影响研究结果的可靠性[22]。因此,此类试验实施过程中,可不要求研究者定期查阅纸质或者电子版的医院记录来发现不良事件,反而是基于电子化的研究数据的中心性监查可有效帮助、及时发现潜在的问题。
6.2 基于风险的监查
在简单易行的运行方式中,基于风险的监查(risk based monitoring,RBM)方法是提高数据质量和保证受试者安全的重要手段[22]。基于风险的监查需要结合研究设计的复杂程度,包括终点类型、研究人群的复杂性、试验药物的安全性等因素,全面评估可能影响临床试验质量和受试者安全的风险,针对关键的风险进行监查。
监查可采用中心化远程监查与现场监查相结合的方式进行。中心化监查是保证研究质量的最主要手段。EDC除了提供实时的CRF信息之外,还能够同时记录研究者数据采集等操作的相关信息。基于电子化的研究数据,建立研究管理系统,进行中心性的数据分析,有助于及时发现传统的现场监查难以发现的问题。利用中心性监查能够识别明显偏离平均水平的研究中心,发现访视问卷完成耗时过短、访视问卷集中于非正常访视时间完成等异常现象,这些现象提示数据质量可能存在问题,从而为针对性监查提供线索。基于实时数据分析的中心化监查可发现90%的重要问题[22],其效力远远大于现场监察。
现场监查作为中心化监查的补充,可核实中心化监查发现的疑点或到现场检查必要的记录,帮助研究者解决研究中出现的问题,必要时对其提供额外的针对性培训。在可能的情况下,经受试者同意,监查员可观察受试者访视的过程。通过现场监查,监查员可根据研究需要随机抽检各种记录,但视研究的规模和具体情况而定,不一定需要常规检查病历以发现漏报的不良事件、严重不良事件或其他研究终点。中心化监查的结果可用于指导现场监查的时间和性质。
6.3 源文件归档
源文件指临床试验中产生的原始记录、文件和数据。在简单易行的临床试验中,电子CRF以电子数据方式将受试者的回答记录保存于服务器,便于核查,其中包括依从性评估、受试者报告终点事件、不良事件和研究药物发放记录等。电子CRF的记录方式与门诊病历记录一样,完成后导出打印,可作为门诊病历归档,遵循《药物临床试验质量管理规范(2020)》关于“以患者为受试者的临床试验,相关的医疗记录应当载入门诊或者住院病历系统”的要求[8]。此外,研究的源文件还包括当地或中心实验室分析结果,不良事件(AEs)的相关支持性资料等。
总而言之,采用简单易行的运行管理及质量控制方式,确保试验质量,是未来大规模临床试验发展的趋势。在研究者发起的临床试验中,如果药物的安全性已经有非常充分的证据,可采用更加简单易行的方式。近期由美国杜克大学研究团队在《新英格兰医学杂志》发表的ADAPTABLE研究[23],旨在比较阿司匹林81 mg/日和325 mg/日对于预防严重血管事件的疗效和安全性,采取了电子知情同意书、受试者门户网站随访、受试者自行购买研究药物、受试者自报研究结局等简单易行方式,受到了广泛关注。
7 信息技术的相关问题
新冠肺炎疫情对当代临床试验的格局产生了重大影响,导致受试者入组困难、受试者依从性降低和研究时间延长等诸多问题,数字化信息技术有望成为一项重要的应对策略。数字化、远程化和智能化等新型信息技术的发展推动了临床试验范式的变革,为临床试验的实施和开展带来了新机遇。充分利用这些技术优势,能够在一定程度上扩大受试者的招募范围,加速入组和降低脱落率,还能够实现远程监管,从而提升临床试验效率,降低临床试验成本[24-25]。但是,如何将信息技术合理高效地应用于临床试验,合理规避应用过程中的伦理风险和数据安全问题,并采取措施进行质量控制,仍然是一项重大挑战。本共识将针对上述问题的应对策略进行探讨。
7.1 临床试验设计的信息化适应
数字化背景下,在方案设计时,研究者需要充分考虑数字化、远程化、智能化等信息技术的适用性及应用场景,充分结合目标适应证的临床特点选择适当的信息化媒介[26]。需要强调的是,并不是所有临床试验、受试者人群或适应证都能采用信息化手段,例如肿瘤I期临床试验和某些急性疾病的研究,涉及到影像、病理活检、高风险干预等内容,需要研究者密切监测并随访受试者,可能不完全适合远程化技术的应用。此种情况下,考虑数字化、智能化与传统临床试验相结合的模式,是一种较为可靠的实施策略。近年来有研究者采取网络社交媒体招募受试者,这种方法可能引入选择性偏倚。研究者应该谨慎使用远程化手段评估的研究终点,其有效性需要进行充分验证。在临床试验设计时,需根据临床试验的特点,采用最合适的信息化技术。当缺乏足够信息进行判断时,可先开展小规模预试验评估可行性[25]。
7.2 信息技术在临床试验中的伦理问题
在信息技术的应用中,研究者需要重点关注某些伦理问题,尤其是保证远程参与的受试者的充分知情和同意确认。数字化技术支持下的临床试验中,通过网络招募的受试者可能面临个人信息和个人隐私的泄露(如个人身份信息、地理位置信息等)的巨大风险。应对这些问题,必须要事先制定与电子知情同意相关的标准操作规程,采用包括文本、图形、音视频、生物识别器和读卡器等方式传达与研究有关的信息,并获得知情同意的记录[26],同时对个人信息和个人隐私进行脱敏,尽可能地保护受试者的个人权益。远程签署电子知情同意时,应符合《电子签名法》等相关法规的相关要求。相关内容在“保证数据安全的措施”中有更详尽阐述。
7.3 数据的安全性、可靠性和合规性
在临床试验运行过程中,应确保数据能够安全可靠地采集、传输和储存。研究者应参考监管机构发布的相关指导原则以及行业专家达成的共识(或者规范),例如《药物临床试验质量管理规范》《新冠肺炎疫情期间药物临床试验管理指导原则(试行)》《药物临床试验的电子数据采集技术指导原则》及FDA 21 CFR Part 11等,确保流程的合规性及数据的可靠性和安全性。
数据采集的信息化系统需要经过规范测试和严格认证,并将网络安全作为认证的重要内容,确保系统的安全性、稳定性和合规性。在数据访问权限上,依据“需要知道”和“最少特权”的安全原则[25],定期审查和更新,以防出现隐私泄露的风险。此外,应用区块链技术可在一定程度上降低数据泄露的风险[27]。
7.4 实施过程中的质量和风险管控
电子化数据采集及管理方式在临床试验中的应用,对质量风险管理提出新的要求。在临床试验院外操作授权、远程受试者招募、电子化知情同意、远程访视和监查、受试者隐私保护等远程化、智能化操作方面需要设立严格的风险控制措施。此外,在信息化背景下,受试者的随访、数据采集、药物配送、生物标本采集与运输等都可能通过远程化方式执行,使操作更为便利。但缺少与受试者的当面沟通可能影响其依从性,需要额外加以注意。可考虑通过提供日记卡或可穿戴设备,以及定期联系(通过电话、电子邮件等方式)受试者了解试验情况等方法,提高受试者的依从性。
临床试验的信息化建设属于新兴领域,为临床试验带来了新的研究方式。试验设计、获得伦理委员会批准、受试者招募、受试者知情同意、研究数据采集、受试者访视、数据监查、重点指标测量、不良反应报告、统计分析等各环节都可通过数字化、远程化、智能化方式开展,但也面临诸多挑战。基本原则是尽早与监管机构及伦理委员会沟通,咨询并征求其意见和建议。在合规的前提下,组建多元化的研究团队,包括临床专家、方法学专家、伦理专家、数据管理分析专家、网络安全专家、工程师等,不断探索完善,稳步推进实施,以满足监管与注册要求。
8 数据安全的伦理问题
临床试验采集的受试者相关研究数据,可包括健康状况数据、医疗应用数据、医疗支付数据、临床研究病例数据和生物组学数据等个人属性数据。随着时代的发展进步,研究中受试者的隐私,个人信息及数据安全等问题日益受到了广泛关注。受试者隐私或个人信息的泄露可能造成其社会污名化或歧视,进而造成精神性和社会适应性的伤害。我国法律规定,受试者的个人信息和个人隐私受法律保护。涉及人类遗传资源相关信息属于国家秘密的,还需依规实施保密管理。开展数据处理活动,需履行数据安全保护义务。如发生信息泄露,研究者将承担相应的法律责任[28-36]。为此,开展临床试验必须对研究数据的收集、存储、使用、加工、传输、提供和公开等各项活动采取切实可行的必要措施,保护个人信息及个人隐私信息,保证数据的安全性[37]。
8.1 尊重受试者的知情权
研究者有义务为潜在的受试者提供充分的信息,从而让受试者自由选择是否参加研究。无论是用于特定的研究项目,还是目前尚无特定目的的未来研究,均需获得受试者的知情同意。研究者还应保证允许受试者在试验过程中无条件撤回授权以满足知情的选择退出程序[33]。对于目前尚无特定目的的未来研究,可采用广泛知情同意的方式。伦理接受广泛知情同意的前提是有合宜的研究管理,且研究目的明确后,需再次经伦理审查批准方可开展研究[28-29,36,38]。
遗传数据难以做到完全匿名化,理论上可把个人数据与有遗传信息和标识符的生物学样本联系起来,因此对于遗传数据应有更多的保护措施[29]。按规定,对于涉及采集我国人类遗传资源的研究,需事先告知受试者并获得其书面知情同意[30]。如需利用临床/研究剩余标本或者遗传数据进行其他目的的研究,则必须经伦理委员会审查批准并再次获得受试者同意[29,35]。
研究者必须全面、真实和准确地告知受试者试验过程中与所收集数据相关的内容,并确保数据的使用不超过知情同意告知的范围。告知内容包括:数据收集的目的、收集方法、数据储存、数据处理(如匿名化或去标识化处理)、数据使用范围、数据保管、研究数据的保密范围和措施、可能的数据泄露风险,并且应告知受试者有自愿参与和随时无条件退出的权力,以及研究过程中可撤回其数据以及如何撤回。此外,还需告知以下内容:是否告知研究目的以外的研究发现,以及相应的实施方式;数据分析结果可能与个人信息的哪些来源相关联;什么类型的研究需要获得受试者的再次同意才能实施;谁将从研究中受益;向受试者通报研究结果的机制;如何确保受试者的权益不受损害等[28-29,35,39]。
8.2 保证数据安全的措施
尽管临床试验结束时可将数据匿名化,但研究过程中仍然存在有身份标识的个人信息被泄露的风险。在设计临床试验时,研究者必须针对个人信息及数据安全采取措施,确保数据处于有效保护和合法利用的状态,并具备保障持续安全状态的能力。具体措施可考虑但不限于以下方面[8,36-40]:
① 建立数据保密制度:数据保密是临床试验过程中必须遵守的基本原则,研究机构应设定程序保证研究数据的保密性,建立及签署保密协议以规范相应人员的行为,建立保密系统防止数据库的泄密。
② 分权限管理数据:对数据控制者及数据使用者执行功能和数据访问分权限管理,并限制第三方对数据的使用权限。
③ 去标识化:在不影响数据完整性的条件下,对敏感的个人属性信息进行处理,针对可唯一识别到个人或披露后会给个人造成重大影响的信息,应去除个人属性信息;针对可间接关联到个人的信息,宜进行泛化、转化等处理,例如数据匿名化或去标识化。去标识化所使用的代码,应严格保密,原则上代码索引仅由开展研究的医疗机构保存,企业不能获得未去标识化的数据。
④ 数据加密处理:对数据进行加密处理,保证数据存储,传输的保密性和完整性,加密数据和密钥应分别存储。
⑤ 控制数据使用数量:仅使用所需的最小数据集。
⑥ 有数据修改的过程管理:确保数据管理过程可溯源,研究者对数据进行修改需要签名,中间过程数据需保存,不得覆盖原有过程记录。
⑦ 制定数据备份集恢复策略:定期对数据进行备份,建立介质存取、验证和转存管理制度。
⑧ 数据核查:建立数据核查机制。在不违反保密原则和相关法规的前提下,监查员、稽查员、伦理委员会和药品监督管理部门检查人员可查阅受试者的原始医学记录,以核实临床试验的过程和数据。
⑨ 数据发布和共享:发布临床试验结果时受试者的身份信息应保密。去标识化后的数据可在研究者之间自由共享。
9 结语
临床试验是医药创新和改善诊疗过程中不可或缺的环节。科学的设计和实施是确保临床试验获得可靠结论的基石。期待我国广大临床试验研究者和相关从业人员不断提升能力,开展更多高质量的临床试验,为打造具备国际竞争力的创新医药生态系统提供有力支持,为临床决策提供更多科学证据。
《药物临床试验设计与实施中疑难问题处理的专家共识》专家名单
执笔:李济宾(中山大学肿瘤防治中心),王书航(中国医学科学院肿瘤医院),李婧(中国医学科学院皮肤病医院),张丽华(中国医学科学院阜外医院),冯芳(中国医学科学院阜外医院),李静(中国医学科学院阜外医院)
专家共识写作组(按姓氏拼音排序):
白桦(中国医学科学院北京协和医院),曹国英(复旦大学附属华山医院),曹玉(青岛大学附属医院),陈懋(福建省立医院),车宇航(中国医学科学院整形医院),董志强(内蒙古科技大学包头医学院第一附属医院),冯芳(中国医学科学院阜外医院),郭彩霞(首都医科大学附属北京同仁医院),宦静(中国医学科学院皮肤病医院),姜敏(江西省人民医院),蒋发烨(广东省人民医院),李海燕(北京大学第三医院),李静(中国医学科学院阜外医院),李婧(中国医学科学院皮肤病医院),李济宾(中山大学肿瘤防治中心),李卫(中国医学科学院阜外医院),李雪宁(复旦大学附属中山医院),李卓(中南大学湘雅二医院),林阳(首都医科大学附属北京安贞医院),刘珏(武汉市中心医院),刘利军(中国医学科学院血液病医院),刘中国(山西医科大学第一医院),阮邹荣(浙江大学医学院附属第二医院),商朴(中国医学科学院阜外医院),孙明媛(中国医学科学院血液病医院),唐蕾(中山大学附属第一医院),王白璐(山东大学齐鲁医院),王彩娥(河南科技大学第一附属医院),王焕玲(中国医学科学院北京协和医院),王清(中日友好医院),王书航(中国医学科学院肿瘤医院),王淑梅(河北医科大学第二医院),王婷(兰州大学第一医院),王晓霞(山西医科大学第二医院),王欣(北京医院),向瑾(四川大学华西医院),徐懿萍(上海交通大学附属瑞金医院),阳国平(中南大学湘雅三医院),岳熠(中国医学科学院血液病医院),邹燕琴(中山大学孙逸仙纪念医院),张海波(中国医学科学院阜外医院),张庆瑜(天津医科大学总医院),郑姣(湖南省人民医院),张丽华(中国医学科学院阜外医院),郑昕(中国医学科学院阜外医院)
利益冲突:所有作者均声明不存在利益冲突。