
第四节 药物临床试验设计原则和标准操作规程
一个周密而完善的临床试验应当能够很好地实现研究目的,客观、准确地量度重要的临床指标,避免或最低程度地降低各种偏倚和误差因素。临床试验的设计包括设计方法的选择、避免偏性的方法(对照、随机、设盲、样本量)、受试者的选择、剂量和治疗方案、疗效和安全性的评价指标和方法等方面。
一、临床试验设计的“四性”原则
临床试验的设计应符合“四性”原则,也称为4R原则。“四性”即代表性(representativeness)、重复性(replication)、随机性(randomization)、合理性(rationality)。
(一)代表性
代表性是指从统计学上讲样本的抽样应符合总体规律,即临床试验的受试者应能代表靶人群的总体特征的原则,既要考虑病种,又要考虑病情,所选的病种还要符合药物的作用特点。在临床试验中,患者的疗效能够充分体现药物的药理作用,同时在病情轻重方面也不能偏倚。例如,不能只入选病情轻的患者或只入选病情重的患者;不能故意在试验组入选病情轻的患者,对照组入选病情重的患者。为了试验结果具有代表性,样本量必须足够大,满足统计学要求。
(二)重复性
重复性是指临床试验的结果应当经得起重复检验,这要求在试验时尽可能克服各种主客观误差,设计时要注意排除偏性(bias),例如,病例分配时的不均匀误差;询问病情和患者回答时可能存在主观误差;试验、检查的先后可能发生顺序误差;指标检测存在技术误差;对指标变化作出解释时可出现判断误差;环境、气候的变化等可能造成条件误差等。因此,应当对各种误差有足够的认识,并在试验设计时给予排除,才能保证试验结果的可重复性。例如,分配病例时采取随机化法,以排除病例分配时主、客观因素导致的不均匀性;治疗方法采用双盲,避免研究者及受试者对病情和治疗效果的主观偏倚;判断标准尽可能地细化和明确,避免不同研究者判断标准的不一致。尤其对多中心临床试验,各中心应当采取统一的试验条件和判断标准以保证试验结果的重复性。
(三)随机性
随机性要求试验中两组患者的分配是均匀的,不随主观意志为转移。随机化是临床试验的最基本原则,不但可以排除抽样不正确引起的非均匀性误差、顺序误差和分配方法不当引起的分配误差,而且通过与盲法相结合,可以排除主、客观偏性,提高试验的可信度。
(四)合理性
合理性是试验设计既要符合专业要求又要符合统计学要求,同时也要切实可行。例如,在试验设计时,要预先确定病例的入选标准和排除标准,在试验过程中不得随意取舍病例,对不符合要求的病例必须按排除标准予以淘汰;在受试者的选择和治疗上,既要考虑临床试验的科学性,还要考虑受试者的安全性;在检测方法上,既要考虑仪器设备的先进性和准确性,还要考虑各中心仪器设备的可及性和可行性。
二、对照试验
有比较才能鉴别,某种治疗措施只有与其他治疗方法比较,才能了解其优劣。因而,设置对照是科学地评价一项治疗措施必不可少的。
(一)设置对照的意义
1.科学地评定药物疗效
临床医学虽较前有了长足的进展,但目前依然有不少疾病(尤其是慢性病)的自然史不能预测,判断某一患者的预后尤为困难。而临床医师正是运用疾病自然史和预后来评价药物疗效的。若未设对照组,则极易将疾病的缓解误认为是药物的疗效。
2.排除非研究因素对疗效的影响
临床试验中,除研究因素外,研究对象所具备的其他因素如年龄、性别、疾病类型、病程、严重程度和治疗经历等均可影响疗效。
3.确定治疗毒副反应的可靠方法
药物临床试验中,部分患者出现不同程度的异常反应较为常见。临床医师应能正确地判断上述反应是疾病本身的表现,还是药物的毒副作用,这只有与对照组比较才能做到。
(二)对照的类型
1.随机对照(randomized control)
按随机化方法将研究对象分为研究组和对照组,同时分别给他们规定的治疗措施和安慰剂或不给予任何措施。观察一定期限后,比较和分析两组的疗效,得出试验结论。
这种对照类型的优点首先从理论上讲可使研究组和对照组外的因素,如临床特征、预后和其他因素在两组间可比。其次是能消除研究人员或患者在患者分组上的主观因素,即消除了选择偏倚。第三是应用统计学方法来比较两组疗效时,这种类型更适宜于作卡方检验和t检验,而不需要用其他方法来校正。这种对照类型的缺点是一项试验需要较多的患者,因有一半患者充当对照。此外,还涉及医德问题。并不是所有的临床疗效评价都要随机对照这种方法。多年来已在临床实践中证实其疗效的疗法,虽未经随机对照证实,但也不再需用此法加以评价。另外,某些罕见病,难以收集足够多的患者以及某些致死性疾病均不宜用此法来评价疗效。
2.非随机同期对照(non-randomized concurrent control)
这种类型的临床试验设计是由主管医师实施分配,或在协作科研中按不同医院加以分组,即一所医院作为对照组,依然实施现行疗法,而另一所医院作为研究组推行新疗法。经过一段时间后比较两组的疗效。这种设置对照的方法简便易行,也易为患者和医师接受。主要缺点是不同医院收治的患者在基本临床特征与主要预后因素分布上不均衡,缺乏可比性,致使临床试验的结论产生偏倚。
3.历史性对照(historical control)
此型对照是一组患者(研究组)接受新疗法,将其疗效与以前某个时间用某种方法治疗的同类型患者(对照组)的疗效加以比较。这是一种非随机、非同期的对照研究。这种对照的资料来自文献和医院病历资料。此型对照的优点是:①易为患者接受,也符合医德;②省钱、省时间。其缺点是:①不少文献资料缺乏研究对象有关特征的记载,有的医院病历资料残缺不全,难以判断两组是否具有可比性;②由于科学的进展,诊断手段的改进,使得一些轻型或不典型患者能够得到早期诊断,再加上护理技术的进步,使得对比两组疗效上的差别并不完全反映不同疗法的差异,从而使研究结论不正确。因此,对自然病程非常清楚,不治疗必死无疑的疾病用此型对照较为合适。此外,所用的历史性对照资料与当前研究工作的时间间隔越久,可靠性越差。
4.交叉设计(cross over design)
整个设计分为两个阶段。先将研究对象随机分为研究组(A组)和对照组(B组)。第一阶段研究组接受治疗,对照组接受安慰剂。此阶段结束后,两组患者均休息(洗脱,停药)一段时间。之后再进入试验第二阶段,但两组在接受治疗措施上对调。这种设计不仅有组间对照,而且有自身前后对照,从而降低了两组的变异度,提高了评价疗效的效率,同时也可用较少的样本完成试验。但采用交叉设计必须有一个严格的前提,即进入第二阶段之前,两组患者的病情均与进入第一阶段时相同。这对许多临床试验来说是难以做到的,从而限制了这种研究设计的使用。
5.序贯试验(sequential trial)
与一般临床试验不同,序贯试验设计可事前先不规定样本量,而是试验一个或一对研究对象后,进行分析,决定下一步试验,至作出结论时即可停止试验。这样可以避免由于不切实际地增加样本量或研究对象数量过小造成的缺陷。序贯试验的优点是:①适合于临床应用;②节省研究对象人数;③计算方便。缺点是:①只适用于单指标试验;②不适用于大样本试验和慢性病疗效观察。
(三)随机化
这项原则的目的是将研究对象随机分配到研究组和对照组。这是设置理想均衡对照的方法。理论上,它可使已知和未知的影响疗效的因素在两组间均衡分布。随机化的方法很多,临床试验中较为常用的有:简单随机化、区组随机化、分层随机化。
简单随机化容易受样本量的限制,当样本量较小时,会出现组间总例数和组间影响预后因素分布的不均衡。为了保证随机分组的均衡性,提高统计检验效率,临床试验中通常采用区组随机化或分层随机化。区组随机化可保证组间总例数的均衡,而分层随机化可保证分层的因素在组间分布均衡。也有将两者联合使用,即所谓分层区组随机化。该方法保证了分层因素和组间总例数的均衡。但考虑的分层因素不能太多。当分层因素较多时,容易出现某些层没有病例或病例太少的情况,导致分层区组失去作用,继而导致组间总例数的不均衡。
(四)盲法
开展临床试验的目的是正确评价一项治疗措施的疗效,用以指导临床实践。这就需要避免各种因素对正确评价的影响,即避免这些因素产生的偏倚。随机化方法可在很大程度上消除选择偏倚,而要消除观察偏倚就要运用盲法(blindness)原则。这项原则的做法是临床医师、研究对象和试验设计人员中的一个、两个或三个都不知道研究对象接受什么治疗措施。
而在非盲试验中,临床医师、研究人员和研究对象本人均知道分组情况和接受什么治疗措施,这是非盲临床试验结论常不可靠的原因。有些临床试验只能是非盲的,如探讨改变生活习惯对冠心病发病的影响。此法的另一缺点是分配到对照组的患者因多种原因退出试验的事例并不少见。
另外还有一种概念称之为“安慰剂效应(placebo effect)”。多数药物既有特异作用,也有非特异作用,研究对象使用安慰剂后会出现某种反应,称作安慰剂效应。安慰剂对照研究的目的不只是确定一项措施有无临床价值,更重要的是判断某项措施的效应是否超过安慰剂的效应。通过对比,就可知道一项治疗措施特异的和非特异的作用程度。这对一项治疗措施的临床应用具有重要的指导意义。
为了避免患者和医生在评价治疗结果时的主观因素和偏倚以及安慰剂效应,以便获得可靠的研究数据,临床试验往往采用盲法设计,临床试验中盲法主要分为:
1.单盲试验
在这种临床试验中,研究对象不知道所接受措施的具体内容,从而避免了其主观因素对疗效造成的偏倚。但临床医师了解这些措施,这样可使研究对象在临床试验过程中的安全得到保证。此法不能避免临床医师主观因素对疗效判断的影响。另外,有时要真正“盲”患者也很困难。
2.双盲试验
在这种类型的试验中,患者和临床医师均不知患者的分组情况和接受治疗措施的具体内容,这样可极大减少两者主观因素对判断研究结果的影响。但此法设计较复杂,实施也较困难,还需要有第三者负责监督试验全过程(包括毒副反应的检查)以保证研究对象的安全。此外,在药品制作、采购、分发和观察疗效等方面要有一套严格的制度,并教育工作人员切实遵守。另外,在试验过程中要“盲”临床医师确实有一定困难。
3.三盲试验
为了改善双盲效果,也可能用到三盲试验。该试验是指不仅对受试者和研究者设盲,对试验监查员、研究统计人员等也需要设盲。由于统计人员也不清楚设盲的情况,为了进行分析统计,需要进行两次揭盲。一般情况下,将所有数据输入系统数据库、核查后锁定,进行第一次揭盲(即先将数据分为A、B两组,但不清楚哪组为试验组);然后进行统计分析,A、B组分析数据出来后进行第二次揭盲,此时明确A、B组分别代表的是试验组抑或对照组。
三、临床试验设计要点及操作流程
血液病药物临床研究过程通常分为Ⅰ期、Ⅱ期和Ⅲ期临床试验。Ⅰ期临床试验的主要目的是对药物的耐受性、药动学进行初步研究,为后期研究给药方案的设计提供数据支持;Ⅱ期临床试验主要是探索性研究,如给药剂量探索、给药方案探索、肿瘤有效性探索等,同时也观察安全性;Ⅲ期临床试验则在Ⅱ期临床试验基础上进一步确证患者临床获益情况,为获得上市许可提供足够证据。
(一)Ⅰ期临床试验方案设计要点
Ⅰ期临床试验是新药第一次应用于人体,大多数抗肿瘤药物的研发过程都会经历多元化的Ⅰ期临床研究。Ⅰ期临床研究可根据首要的治疗目的来决定治疗方案(单独或组合使用药物的方案和用药剂量),这对于患者的安全给药和进一步有效性研究具有意义。早期的Ⅰ期临床试验侧重于描述和理解有效使用任何药物所需的临床特性,如识别潜在的剂量限制毒性。在Ⅰ期抗肿瘤药物临床试验中,必须要测定其PK参数、评估药效学、监测毒性以及确定抗肿瘤活性的重要数据。在研发过程中尽可能早地了解这些参数对于确定最佳Ⅱ期临床试验的剂量非常重要。在Ⅰ期抗肿瘤药物临床试验中能够获得疗效方面的提示,这是抗肿瘤药物开发和其他治疗领域药物开发之间的重要差别。疗效证据是否必须在进一步开发检查前得以证明这一问题一直有所争论。在分子靶向时代,许多Ⅰ期临床试验已与发现临床活性初步证据的目标结合在一起。
出于伦理考虑,Ⅰ期临床试验一般不应入选能在常规治疗中获益的肿瘤患者,而应选择标准治疗失败或没有标准治疗的晚期肿瘤患者。由于该类肿瘤患者身体状况通常较差,且往往在进入试验前接受了多种其他治疗,可能影响对药物相关反应的观察,因此制定患者入组标准应非常谨慎。在Ⅰ期临床试验中通常选择不同类型肿瘤进行试验,瘤种类型可参考临床前药效研究结果。对于分子靶向药物,根据靶标筛选受试者对疗效的评价以及个体化治疗也是有帮助的。
Ⅰ期临床试验方案应包括依次进行的三部分,即单次给药耐受性试验方案、单次给药药动学试验方案、连续给药药动学及耐受性试验方案。
1.Ⅰ期临床试验方案
(1)首页。
(2)试验药物简介,包括中文名、国际非专利药名(international nonproprietary names of pharmaceutical substances,INN)、结构式、分子式、分子量、理化性质、药理作用与作用机制、临床前药理与毒理研究结果、初步临床试验结果。
(3)研究目的。
(4)试验样品,包括样品名称、编号、制剂规格、制备单位及制备日期、批号、有效期、给药途径、储存条件、样品数量并附药检报告单。
(5)受试者选择,包括纳入标准、排除标准、入选人数及登记表。
(6)筛选前受试者签署知情同意书。
(7)试验设计与研究方法。
2.单次给药耐受性试验设计与研究方法要点
此阶段试验是在经过详细的动物实验基础上,观察人体对该药物耐受程度,找出人体对新药最大耐受剂量及其产生的不良反应,是人体的安全性实验,为确定Ⅱ期临床试验用药剂量提供科学依据。
(1)常采用无对照开放试验,必要时设安慰剂对照组进行随机双盲对照试验。
(2)最小初试剂量按Blackwell改良法计算并参考同类药物临床用量进行估算。
(3)最大剂量组的确定(相当于或略高于常用临床剂量的高限)。
(4)由最小剂量组开始逐组进行试验,在前一个剂量组安全耐受前提下开始下一个剂量,每人只接受一个剂量,不得在同一受试者中在单次给药耐受性试验时进行剂量递增连续试验。
(5)方案设计时需包括处理不良反应的条件与措施。
(6)与试验方案同时设计好病例报告表、试验流程图(chart)等。
3.单次给药药动学试验设计与研究方法要点
(1)剂量选择:选择单次给药耐受性试验中全组受试者均能耐受的高、中、低3个剂量,其中,中剂量应与准备进行Ⅱ期临床试验的剂量相同或接近,3个剂量之间应呈等比或等差关系。
(2)受试者选择:选择符合入选标准的8~10名健康男性青年志愿者,筛选前签署知情同意书。
(3)试验设计采用三交叉拉丁方设计,全部受试者随机进入3个试验组,每组受试者每次试验时分别接受不同剂量的试验药,3次试验后,每名受试者均按拉丁方设计的顺序接受过高、中、低三个剂量,两次试验间隔均应超过5个半衰期,一般间隔7~10天。
(4)生物样本选择适宜的分离测试方法,最常用的方法为高效液相色谱法。
(5)药动学测定方法的标准化与质控方法。
精确度(precision):日内差CV%应<10%,最好<5%。
重复性(reproducibility):日间差CV%应<10%。
灵敏度(sensitivity):①要求能测出3~5个半衰期后的血药浓度,或能检测出1/10 Cmax;②确定为灵敏度的最低血药浓度应在血药浓度量效关系的直线范围内,并能达到精确度考核要求。
回收率(recovery):在所测标准曲线浓度范围内药物自生物样品中的回收率应不低于70%。
特异性(specificity):应证明所测药物为原型药。
相关系数(correlation coefficient):应用两种方法测定时,应求相关系数R值,并作图表示。
(6)药动学测定应按国家药品监督管理局审评要求提供药动学参数。
(7)应提供药动学研究总结报告。
(8)研究设计与研究方法。
(9)测试方法、条件及标准化考核结果。
每名受试者给药后各时间点血药浓度、尿浓度与尿中累积排出量的均数±标准差,药-时曲线图;对所得药动学参数进行分析,说明其临床意义,对Ⅱ期临床试验方案提出建议。
4.连续给药药动学及耐受性试验设计与研究方法要点
此阶段试验观察的是药物及其代谢产物在人体内的含量随时间变化的动态过程,主要通过数学模型和统计学方法进行定量描述。
(1)受试者选择8~10名健康男性青年志愿者,筛选前签署知情同意书,各项健康检查观察项目同单次给药耐受性试验。
(2)受试者于给药前24小时、给药后24小时、给药后72小时(第4天)及给药7天后(第8天即停药后24小时)进行全部检查,检查项目与观察时间点应符合审评要求。
全部受试者试验前1天入住Ⅰ期临床试验病房,接受给药前24小时各项检查,晚餐后禁食12小时。试验当天空腹给药,给药后2小时进标准早餐。剂量选择准备进行Ⅱ期临床试验的剂量,每日1次或2次,间隔12小时,连续给药7天。具体操作:①观察指标;②数据处理与统计分析;③总结报告;④末页。
(二)Ⅱ/Ⅲ期临床试验方案设计要点
据前所述,Ⅰ期临床试验可能确定试验治疗药物的临床疗效等事项,第二阶段的研究是专门设计用来探索临床疗效和作为一种药物的临床假说的首要测试。理想情况下,未能证明临床疗效要提前退出Ⅱ期临床试验,最好也不进入Ⅲ期临床试验。
例如,抗肿瘤药物Ⅲ期临床试验的高失败率已被归因于第二阶段试验最终确定的活性化合物不正确的预测值。对于Ⅲ期临床试验结论,Ⅱ期临床试验的结果预测值依赖于与其相关联的样本大小和治疗效果好坏的可信区间。Ⅱ期临床试验预测值也受到不同的分子表型特征或途径的影响。
由于Ⅱ期临床试验是探索性研究,而非确证性研究。因此可以采用多阶段设计、自适应设计(adaptive design)等较为灵活的设计方法。由于恶性肿瘤几乎不可能自行消退,可以认为肿瘤的缩小几乎完全是药物的作用,因此在探索单药治疗效果时,可采用单臂设计(single-arm design)或剂量对照。但在有常规标准有效治疗方法时,应尽量采用随机对照设计,将常规标准有效治疗方法作为对照,目的是尽量在临床试验的早期阶段就能检验出药物相对已有疗效或在疗效上是否具有优势,提高判断是否进入下一阶段研究的把握度。
Ⅲ期临床试验为确证性研究,通过大样本、随机、对照研究设计,确认药物在特定目标人群中的疗效和安全性,可评价肿瘤受试者的临床获益情况。由于Ⅲ期临床试验投入巨大、周期长,因此在决策药物是否进入Ⅲ期临床试验时应慎重考虑以下因素:①是否有特异且明确的靶位;②是否具有明显的抗肿瘤活性;③是否具有良好的药动学特点,如口服生物利用度良好,半衰期长;④目标疾病对新的治疗方法是否有较强的需求;⑤不良反应是否可以耐受和易处理。
例如,在约100例的某晚期肿瘤患者中进行的3种药物的Ⅲ期随机临床试验(氟尿嘧啶、亚叶酸钙、贝伐单抗)为指导Ⅱ期临床试验提供足够充足的信息,最终使第三阶段试验获得成功。这些数据不仅在引导去或不去做这个决定方面做出指示,同样也对于Ⅲ期临床试验的最终规模提供指引,这都是临床试验成功所必需的。另外,对于Ⅲ期临床试验来说,整体存活的优势往往是一个标准的终点,但临床研究也可以注重于其他方面,包括疾病的某种重要并发症及症状。如JAK2抑制剂2011年获FDA批准用于骨髓纤维化治疗,没有在总体生存率或无进展生存期方面表现出特有的优势,但基于两个随机临床试验的良好结果而获得上市批准,这两个随机临床研究是以伴有35%脾脏体积缩小患者的比例为首要终点,以症状评分改善50%的患者比例为次要研究终点。
1.Ⅱ/Ⅲ期临床试验方案设计需遵守的基本原则与指导原则
(1)《赫尔辛基宣言》。
(2)我国现行《药品注册管理办法》。
(3)我国现行《药品临床试验管理规范》。
(4)各类专业的新药临床研究指导原则。
(5)进行国外一类新药(特别是ICH成员国的一类新药)时,除执行我国法律法规与指导原则外,还需符合ICH-GCP要求。
2.Ⅱ/Ⅲ期临床试验方案设计中伦理方面的考虑要点
(1)《赫尔辛基宣言》伦理原则、GCP指导原则。
(2)临床试验方案设计前应认真评估试验的利益与风险。
(3)确保试验设计中充分考虑到受试者的权利、利益、安全与隐私。
(4)临床试验方案、病例报告表与受试者知情同意书均应在试验前经伦理委员会审议批准,并获得批件。
(5)试验开始前需获得每例受试者完全自愿签署的知情同意书,知情同意书一式两份,分别由受试者及研究者保存。
(6)参加试验的研究人员应时刻负有医疗职责,保证受试者的用药安全。
(7)每个参加试验的研究人员应具有合格的资格并经过很好的训练。
(8)临床试验应建立试验质量控制系统。
3.Ⅱ/Ⅲ期临床试验方案设计中专业方面考虑的要点
(1)试验方案设计时应充分考虑GCP指导原则中有关专业方面的规定,并符合《新药临床研究指导原则》中规定的技术标准;同时严格执行NMPA《药品注册管理办法》中规定的注册要求。
(2)Ⅱ期临床试验必须设对照组进行盲法随机对照试验,常采用双盲随机平行对照试验。双盲法试验用药在外观、色香味等方面均应一致,只标明A药或B药,如制备外在特征无区别的A、B两药确有困难时,可采用双盲双模拟法。Ⅲ期临床试验方案的设计要求原则上与Ⅱ期临床试验相同,但Ⅲ期临床的对照试验可以设盲也可以不设盲,进行随机对照开放试验。
(3)Ⅱ/Ⅲ期临床病例数估计(assessment of trial size):各期临床试验病例数应符合NMPA规定的最低要求,即Ⅱ期临床试验的试验组例数不少于100例,做2个或2个以上适应证的,每个适应证不少于60例;Ⅲ期临床试验要求试验组例数不少于300例,未具体规定对照组的例数,可根据试验药适应证多少、患者来源多寡来考虑,如单一适应证,一般可考虑试验组100例、设对照组100例(1∶1),试验组另200例不设对照,进行无对照开放试验;如果有2种以上主要适应证时,可考虑试验组与对照组各200例(1∶1),试验组100例不设对照,若有条件,试验组300例全部设对照当然最好。如果NMPA根据品种的具体情况明确规定了对照组的例数要求,则按规定例数进行对照试验;小样本临床试验中试验药与对照药的比例以1∶1为宜。
(4)应制定明确的诊断标准、纳入排除标准,以及观察疗效与不良反应的技术指标和判定指标为正常或异常的标准;根据不同类别的药物的特点和试验要求在试验方案中规定明确的标准。
(5)剂量与给药方法(dosage and administration):参照说明书或Ⅰ期临床试验的结果来制定。
(6)疗效评价(assessment of efficacy):疗效评价标准要选择公认“金标准”,无公认标准的按照新药临床研究及专业治疗的指导原则来制定。
(7)不良反应评价(evaluation of adverse drug reaction):目前存在两种评价标准,即微观评价和宏观评价。所谓微观评价是指具体的某一不良事件与药物之间的因果关系的判断,即个案因果关系判断;宏观评价是指通过运用流行病学的研究手段和方法来验证或驳斥某一不良事件与药物之间的因果关系的假说。
(三)Ⅳ期临床试验方案设计要点
1.Ⅳ期临床试验为上市后开放试验,不要求设对照组,但也不排除根据需要对某些适应证或某些试验对象进行小样本随机对照试验。
2.Ⅳ期临床试验病例数按NMPA规定,要求≥2 000例。
3.Ⅳ期临床试验虽为开放试验,但有关病例入选标准、排除标准、退出标准、疗效评价标准、不良反应评价标准、判定疗效与不良反应的各项观察指标等都可参考Ⅱ期临床试验的设计要求。