
第五节 有效性评价
药物的有效性是批准上市基本要求的必要内容之一,是指因药物治疗而给患者带来在感觉、功能或生存状况上的受益。药物的有效性一般通过药物临床试验来发现和确定,其中两个最关键的因素为:一是需要进行充分良好对照的临床试验,另一个是选择能够直接反映或预测患者临床受益的临床疗效终点指标。例如,血液病患者抗菌药物临床试验中,抗菌药物的疗效应当根据事先确定的临床指标(如体温、痰液、尿液、粪便、皮肤感染部位)、非微生物学检查指标(影像学、白细胞计数和分类、血沉、C反应蛋白、其他炎症标志物、病原微生物的非培养标志物)、微生物学检查指标(细菌涂片、培养、药敏)或其他恰当的终点指标来判断最终的结果。
以下我们就药物临床试验中疗效指标选择的相关问题进行讨论。
1.疗效指标的概念和内涵
药物临床试验评价药物的有效性主要是通过有效性指标的观测和评价来实现。有效性指标又称为疗效指标,是反映受试药物用于患者所表现出临床获益的主要观测和评价工具。疗效指标的选择、测量和比较是药物有效性评价的关键要素。FDA相关法律法规提出了这样的要求:受试者疗效评估方法应定义明确、可靠确实,临床试验方案和试验结果报告应说明疗效测量指标、观察收集方法以及评估受试者反应所采用的相关标准。也就是说,疗效指标主要包括三点:第一是疗效观测指标;第二是疗效观测指标的观测收集方法;第三是以疗效观测指标为基础,从而比较与评价药物效应大小的方法和标准,也就是疗效评价指标。
2.疗效观测指标的分类
反映疾病变化的疗效指标可以是疾病临床终点(如死亡、残疾、功能丧失)、影响疾病进程的重要临床事件(如心肌梗死、骨折的发生),也可以是评价社会参与能力(残障)、生活能力(残疾)、临床症状和/或体征、心理状态等内容的相关量表或其他形式的定量、半定量或定性指标,也可以是通过某些仪器和实验室检查等手段获得的某些客观数据或检查结果,主要包括病理生化等指标如血常规结果,病理检查结果、血脂等。根据以上说明疗效指标可有多种方法进行分类。以下是与血液病药物临床试验疗效指标选择密切相关的几种主要分类方法。
(1)临床结局指标和替代指标:
临床结局指标是指能够反映患者的感觉、功能变化的特征性指标以及与生存状态相关的疾病临床结点,如死亡、残疾、功能丧失等指标。临床结局指标能直接评价药物真实的效应,如症状缓解率、疾病病死率或者严重临床事件发生率等。但由于其中的疾病临床终点指标评价需要的时间长、样本量大、研究成本高,有时还存在伦理学风险,导致疾病临床终点指标观测存在困难或不合理。因此,临床试验常以易观察和测量的疗效指标以替代临床结局指标评价药物的有效性。
替代指标是在直接评价临床获益不可行时,用于间接反映临床获益的观察指标。替代指标是指能够替代临床结局指标、反映和预测临床结局指标变化的指标。替代指标应该是根据流行病学、治疗学、病理生理学或其他科学的证据,能够合理预测临床受益或者对临床结局指标存在疗效的指标。
(2)主要疗效指标和次要疗效指标:
在一个临床试验中,主要疗效指标又称为主要终点,是指能够反映主要临床试验目的、与临床终点结局最有关、最可信证据的疗效指标,是能确切反映药物有效性的指标。在确证性临床试验中,反映药物有效性的主要疗效指标一般应该是该目标适应证同一研究目的下的临床终点结局指标或公认的替代指标。主要指标应根据试验目的选择易于量化、客观性强、重复性高,并在相关研究领域已有公认标准的指标。
在一个临床试验中,次要疗效指标又称为次要终点,次要疗效指标是与次要研究目的相关的效应指标,或与主要研究目的相关的支持性指标。在试验方案中,对次要疗效指标也需明确定义,并对这些指标在解释试验结果时的作用以及相对重要性加以说明。一个临床试验中,可以设计多个次要疗效指标,但不宜过多,以达到试验目的即可。有时,还可以根据对临床试验评价的重要性分为重要的次要疗效指标和一般的次要疗效指标。探索性试验也可以使用与主要疗效终点指标高度相关的次要疗效指标为主探索药物的有效性和量效关系。
3.疗效观测方法
在药物临床试验疗效指标的制定中,应该明确制定疗效指标观测的环境、时间、地点、次数,观测的时间窗、时间间隔,观测值的记录和收集要求,观测质量控制和规定等。例如,将复发事件作为疗效指标,可以是简单的二分类指标(任何指定时间段内的复发),也可以是第一次复发的时间、复发率(在观察的时间单位内的复发数)等。例如,对死亡率的评价,可以观测和比较在某时间点尚存人数的比例,也可以观测在某规定时间段内的生存时间的总分布。观测方法应在确定主要疗效指标的同时一并确定下来。
4.疗效评价方法
药物的临床有效性通过疗效观测指标来记录,疗效评价可以是某一疗效观测指标的直接测量结果。例如,艾曲波帕(eltrombopag)在治疗特发性血小板减少性紫癜的Ⅲ期临床试验中,其主要评价项目选择了血小板计数的上升作为疗效评价的指标;也可以是在直接测量结果基础上转化而来的、特定的评价方法来评价。例如,在淋巴瘤相关的药物临床试验中,其主要疗效指标往往选取总缓解率,那么淋巴瘤是否出现了缓解呢?可以根据Lugano 2014标准进行判断,在该标准中对淋巴瘤的完全缓解给出了如下定义。使用增强CT评估,评为完全缓解(complete remission,CR)需要达到以下条件:①所有可察觉的疾病临床和影像证据、治疗前的疾病相关症状完全消失,非霍奇金淋巴瘤(non-Hodgkin lymphoma,NHL)引起的生化指标(如LDH)恢复正常。②所有的淋巴结和淋巴结肿块必须缩小到正常大小。疗前最大横径>1.5cm者应疗后≤1.5cm;1.1~1.5cm者应≤1.0cm,或最大径乘积之和(SPD)减小>75%。③脾脏若在疗前据CT诊为增大,必须缩小且不可触及;任何影像学肉眼可见的结节必须消失;其他疗前增大的器官如肝或肾亦应缩小。④若疗前有骨髓受侵,须同一处的多次骨髓穿刺或活检表明浸润已清除;组织量不少于粗针活检2cm。Lugano 2014标准中还对如何评价未证实的完全缓解、部分缓解(partial remission,PR)、完全缓解(CR)或不确定的完全缓解(complete remission unconfirmed,CRU)后的复发进行了明确的定义。
5.使用几种常见疗效指标进行疗效评价时需要注意的问题
(1)疾病临床终点指标:疾病临床终点指标一般是指反映患者生存状态等特征的指标,如死亡、总生存期(overall survival,OS)等。由于疾病的临床终点对患者影响最大,因此,又称为临床疗效的硬终点。如果药物对该类疗效指标有效,往往说明药物临床价值较大。但针对以上硬终点设计的某些疾病的新药研发难度也明显增大,主要表现为研发周期越来越长,研发费用也越来越高。该类疗效指标发生率低,多数药物疗效评价需要的临床试验时间长、样本量大、研究成本高。有时还不符合医学伦理,造成临床疗效终点指标观测不合理、不可能。因此,在选择该类疾病临床终点指标时需要充分重视其临床试验的难度。例如,治疗淋巴瘤的最主要目的是降低死亡率,提高生存率,但要证明药物的有效性,可能需要病例数巨大、临床试验时间非常长的大型试验才能完成。而该类新药的临床试验有时可能因为难度太大而不切实际。此时,有临床试验选择了比较两组用药后的淋巴瘤总缓解率作为疗效指标。另外,虽然该类疾病临床终点指标看似客观性较强,但实际临床观察中仍易受到研究者主观判断的影响,如死亡原因的判断等。因此,在临床试验设计中应该对其判断标准具有明确和清晰的规定。并且,鉴于多数终点事件发生率不会太高,每一例患者的判断都可能明显影响药物总体疗效评价结果,而该类试验多数临床观察单位较多,临床试验质量控制难度较大,为此,往往需要设立独立的终点仲裁委员会(EAC),EAC由对治疗分配呈盲态的外部专家组成,负责对本项研究中所有作为主要和/或次要复合终点组分的重要临床事件进行统一盲态下的判定。
(2)替代指标:如上所述,在临床试验中,由于临床结局指标,特别是疾病临床终点指标如总死亡率等作为临床试验主要疗效指标评价时,临床试验难度较大。因此,为了降低临床试验难度,往往选择在其他临床试验中已建立的替代终点作为主要疗效指标进行临床试验,如血小板水平、淋巴瘤的总缓解率等。
需要特别指出的是,虽然替代指标可以降低药物研发成本和试验难度,但不是真正的临床结局指标,且能够广泛使用的替代指标并不多。替代指标可能因为选择不当而导致试验失败。因此,选择替代指标需要特别谨慎。尤其是“新”替代指标。药物在替代指标上的优良表现并不一定代表药物对受试者具有长期的临床获益,药物在替代指标上的不良表现也不一定表示没有临床获益。有的替代指标即使已经被同类药物治疗某一疾病的临床试验验证过,但用于另一个同类适应证的新药研究仍然可能存在风险。
一个疗效指标能否成为临床获益的替代指标,应有以下特点:①指标与临床获益的关联性和生物学合理性;②在流行病学研究中该指标对临床结局的预测价值;③临床试验的证据显示药物对该指标的影响程度与药物对临床结局的影响程度一致。而这些证据的取得往往需要长期大样本的医学研究和发现而逐步取得。例如,升血小板药物的临床获益,应是降低或延迟“终点事件”(危及生命的出血事件)的发生,但若要评价“终点事件”发生率,需要长时间观察。在实际升血小板药物的临床试验中,多采用替代指标“血小板升高值”来评价药物的疗效,因为临床研究和流行病学已经证实:将“血小板”控制在安全范围内,可以降低“终点事件”的发生。需要注意的是,流行病学和病理数据支持的替代指标,对替代指标的疗效有时只有在相对有限范围内显示其实际临床获益,如肿瘤完全缓解(长期无病生存)。此外,除了血小板数目等少数替代指标外,多数替代指标预测临床获益的证据并不充分。因此,使用替代指标批准上市的药品,药品注册申请人必须承诺进行上市后临床试验以确证该药物的实际临床获益。如果上市后研究不能证明该药的临床获益,或者申请人未按要求进行承诺的上市后研究,则FDA可将该药物从市场中撤出。
(3)患者报告结局:近年来,医疗服务日益强调以患者为中心。患者报告结局(patientreported outcome,PRO)是一种可从患者角度为临床研究和实践提供研究疾病活动和评价治疗效果的独特指标。2006年,FDA把PRO定义为“任何来自患者的,有关其健康状况和治疗效果的报告”。PRO作为药物临床试验评价的重要工具,已获得越来越多的研究者关注和提倡。PRO是一个广义的概念,包括临床实践中的许多内容:患者症状(疼痛、疲劳、精力等)的报告;身体、心理和社会活动的功能状态、健康行为,如对治疗的依从性、吸烟情况和参加身体锻炼情况;患者对于不同治疗表达出的不同倾向性,以及患者表示希望(或不希望)参加某项治疗的意愿;患者对治疗的满意度;患者对于医患之间的沟通、合作治疗以及治疗获得手段等方面的报告。PRO多是作为评价患者感觉性症状或功能能力情况,如疼痛、瘙痒、失眠、勃起功能质量量表(quality of erection questionnaire,QEQ)等。PRO也可用于评估检查其他可能的治疗结果(对日常生活或心理状态活动的影响)。但作为临床评价指标,特别是主要疗效评价指标时,PRO需要符合FDA发布的《患者报告的结局指标:药品开发中用于支持标签声明》描述的用于临床试验中主要疗效终点的PRO的要求和条件,特别是信度、效度、反应度和效应标准定义的规定等。如果使用国外的PRO,应该注意其在我国人群中使用的文化和民族适应性。
如果使用PRO作为临床试验主要疗效指标,应该特别注意主要疗效指标与临床试验目的的一致性。①临床试验拟定的患者临床获益的评价只能通过PRO才能较为准确反映。一些非器质性疾病如抑郁症、更年期综合征和失眠等,此时患者提供的自觉症状为诊断这些疾病的唯一证据,如果用于临床试验的药物对患者的自觉症状有改善,并保证治疗安全,那么患者的感受即PRO可作为评估药物治疗效果的重点指标。②应用PRO有利于最佳治疗方案的评价与选择。PRO从患者的角度及利益为出发点,可以提供治疗疾病的额外信息,解释生理及病理指标的变化对患者健康状况的影响,从而反映患者的综合健康状况,为最佳药物疗效和治疗方案的评价与选择提供更多依据。在血液病药物临床试验中应用PRO应属于第二种情况。例如,在芦可替尼治疗骨髓纤维化的临床试验中,研究者采用脾脏大小的变化作为主要终点,以患者自述结果、改良的骨髓纤维化症状评估表(MFSD)作为支持。为了加强临床相关性,改良的MFSD将重点放在患者具有临床意义的症状,如盗汗、瘙痒、饱腹感、腹部不适等。而总生存期在药品注册为目的的试验中不是必须指标,因此这种设计不仅使注册监管机构加快了审批,使药物能够尽早用于患者,也有助于加快临床试验中的患者入组。
综上,药物干预是影响疾病临床结局的主要因素之一,药物临床试验有效性评价就是观测药物干预对疾病临床结局的影响结果。疗效指标的设计、观测和评价是药物临床试验的重要内容,特别是用于药物临床试验有效性评价的主要疗效指标选择有很多原则和指南。应根据不同的临床试验目的,选择合适的主要疗效指标。不同类型的疗效指标在临床评价时有不同的要求和需要注意的问题,需要我们在临床试验疗效指标的选择和使用时充分重视。