大多数人最熟悉的随机对照临床试验 (randomized controlled trial, RCT) 可能是标准的双臂、平行设计、基于个体随机分组的试验。一般情况下,两组包括试验组和对照组(或者治疗组/安慰剂组)。但是 RCT 的分组可以多于两组(多臂 RCT)。例如,将治疗组、无效对照组/安慰剂组与另一种现存有效的治疗进行比较的一项三臂 RCT。本质上而言,对于多臂 RCT 可以使用标准双臂 RCT 的评价核查清单进行评价。不过,应考虑一些其他问题。 

研究分析的是每组间两两比较的差异还是所有组间的总体比较差异(例如 ANOVA 检验)?

可能难以解读组间的统计学评估,尤其当您只对其中一对比较感兴趣且很难将结果归于您所感兴趣的比较组时。

合并数据的方式也会影响结果,因此您必须注意合并选择性数据的问题。

为什么 RCT 评估两个以上的研究组?

不同的研究组是否评估相关的临床问题?示例 1:治疗方案A的两种不同剂量与对照B,相关的问题是:我们是否应该使用、以及以何种剂量使用治疗方案 A?示例2:治疗方案 A、以往的金标准治疗方案 B 与无效对照C 之间的比较,相关的问题是:我们是否应该将治疗方案 A 作为新的一线治疗?

另一种情况是,不同的研究组评估独立的问题,而由于效率/后勤方面的原因在同一个试验中进行检验,例如,新的治疗方案 A 与新的治疗方案 B 和标准对照C 比较时,独立的问题分别是:新的治疗方案 A 是否比标准治疗方案C 更好?以及新的治疗方案 B 是否比标准治疗方案C 更好?

RCT 是否应用了任何多重校正因子?

有人提出,在特定的数据集上增加分析的次数可能在某些情况下增加 I 类错误的概率(即由于偶然性而将不具有显著性的结果判定为具有显著性)。例如,您对双臂(两组)试验中治疗方案 A 与治疗方案 B 比较的特定结局感兴趣,那么您只有一种方法进行比较(A vs B)。然而,在治疗方案 A、B 和 C 相互比较的三臂(三组)试验中,您可以对同一数据集进行 3 种不同的两两比较(A vs B、A vs C、B vs C)。随着研究组数量的增加,比较的数量也会相应增加,例如,在治疗方案A、B、C 和 D 比较的四臂试验中,您将有 6 种不同的两两比较方法(A vs B、A vs C、A vs D、B vs C、B vs D、C vs D)。为了弥补这一点,一些研究采用了 Bonferroni或类似的校正因子。然而,关于究竟是否需要根据研究设计进行调整以及应该如何调整,一直存在一些争议。例如,有人担心应用 Bonferroni 或类似的校正可能会增加发生 II 类错误的概率(即摒弃一个确实存在且真实的显著性差异结果)。

无论研究采用何种方法,都应该清楚地描述它所评估的组间比较和统计学检验及其基础。应对结果的可能解读进行评论,以便您可以决定分析的有效性,从而对结果进行解读。

阅读更多相关信息