推荐的分级、评估、制定与评价 (Grading of Recommendations, Assessment, Development and Evaluations, GRADE) 是一个简单易懂的结构框架,用于制定和展示对证据的总结,并提供一种制定临床实践推荐的系统性方法[1-3]。在给证据质量进行分级和制定推荐方面,是使用最广泛的工具,全世界已有 100 多家机构正式认可。

如何使用?

首先,作者确定临床问题是什么,包括该问题适用的人群、两种或更多种替代方案以及对面临这个决定的人们来说最重要的结局 [4]。一项研究(理想情况下是系统评价)通过使用绝对术语(例如风险差异)提供对每个结局效应量的最佳估计。 [3]

然后,作者对证据质量进行分级,最好对每个结局进行评价。因为各结局的证据质量级别常常存在差异 [5]。总体的 GRADE 质量分级适用于一系列的结局证据,通常采用对决策有至关重要作用的所有结局的最低证据质量 [6]。

GRADE 有四种证据级别,也被称为证据的确定性或证据质量:极低、低、中等和高(表1)。来自随机对照临床试验(randomised controlled trials)的证据从高质量开始,由于残余证据混杂,纳入观察性数据的证据从低质量开始。证据的确定性由于若干原因增加或降低,下面将更加详细地进行描述。

表1. GRADE确定性分级
确定性 含义
极低 真实效应很可能与估计效应明显不同
真实效应可能与估计效应明显不同
中等 作者认为真实效应可能接近估计效应
作者确信真实效应与估计效应相似

GRADE 是主观性的

不能机械地使用 GRADE——在做出每一个决策时,不可避免地存在相当大的主观性。评价同一证据体的两个人可能会合理地得出关于证据确定性的不同结论。GRADE 确实提供的,是一种可重复且简单易懂的证据确定性分级框架 [7]。

什么使证据不确定?

当证据存在偏倚风险、不精确性、不一致性、间接性和发表偏倚中的某一种风险时,作者可以选择将确定性降低一个或两个级别(例如从高到中等)。

GRADE 评价降级的因素

  1. 偏倚风险

当研究结果由于设计或进行研究时的固有局限性而不能代表真实情况时,就会发生偏倚 [8]。在实践中,很难知道潜在偏倚在多大程度上影响结果,因此,如果了解到研究的估计效应可能存在偏倚,则估计效应的确定性将降级。

对于单项随机对照临床试验 [9] 和观察性研究 [10, 11],有几种工具可用于对偏倚风险进行分级。

GRADE 用于在结局层面而非研究层面对证据进行分级。因此,作者必须判定个体研究存在偏倚的风险是否足够大,以至于使估计治疗效果的可信度下降。关于针对偏倚风险的关键考虑,以及从研究层面的偏倚风险转移到证据偏倚风险过程的详细描述,参见 GRADE 指南系列#4:证据质量评价——研究局限性(偏倚风险)[8]。

  1. 不精确性

采用 GRADE 方法对不精确性进行分级时,主要关注对绝对效应进行最佳估计的95%可信区间 [12]。如果当真实效应处于可信区间的上限和下限时,做出的临床决策可能会有所不同,那么确定性就会降级。如果效应估计仅来自于一项或两项小型研究,或者事件极少发生 [13],那么作者也可以选择对不精确性进行降级。关于不精确性的详细描述,参见 GRADE 指南系列#6:证据质量评价——不精确性 [12]。

  1. 不一致性

当一些研究显示出一致效应时,证据主体的确定性最高。当考虑确定性是否应该因不一致性而降级时,作者应该检查点估计值的相似性、其可信区间的重叠性以及异质性的统计学标准(例如,I2和卡方检验)[14]。关于不一致的充分讨论,参见 GRADE 指南系列#7:证据质量评价——不一致性 [14]。

  1. 间接性

当研究直接在感兴趣人群中比较目标干预措施,并报告对决策制定起重要作用的结局时,证据的确定性最高。如果研究患者与推荐适用的患者不同,则确定性可以降级。当所研究的干预措施与实际结局不同时,间接性也可能发生(例如,一项关于在高度专业化的中心实施新型外科手术的研究只能间接地应用于经验较少的中心)。当研究结局是另一种结局(通常是对患者更重要的结局)的替代,间接性也会发生。关于间接性的充分讨论,参见 GRADE 指南系列#8:证据质量评价——间接性 [15]。

  1. 发表偏倚

发表偏倚也许是 GRADE 领域最棘手的问题,因为它需要对缺失的证据进行推断。尽管存在严重的局限性,但几种可视化的统计学方法对发现发表偏倚有帮助。发表偏倚更常见于观察性数据,以及当大多数已发表的研究都是由企业资助时。关于发表偏倚的充分讨论,参见 GRADE 指南系列#5:证据质量评价——发表偏倚 [16]。

什么可增加证据的可信度?

在极少数的情况下,证据的确定性可以升级(见表2)。第一,当效应量极大时,我们可能会更加确定至少有轻微效应。第二,当有明确的剂量-效应关系时。第三,当残余混杂因素可能会减少而非增加效应量时。关于增加可信度分级的更详细讨论,参见 GRADE 指南系列#9:证据质量升级 [17]。

表2. 证据确定性升级或降级的原因
确定性可能降级的原因: 确定性可能升级的原因:
  • 偏倚风险
  • 不精确性
  • 不一致性
  • 间接性
  • 发表偏倚
  • 效应量很大
  • 剂量-效应关系
  • 残余混杂因素可能缩小效应量

从证据质量到推荐

在 GRADE 中,推荐强度可以是强的或弱的,支持或反对使用一种干预措施。强推荐表明所有人或几乎所有人都会选择某种干预措施。弱推荐表明知情者所做出的决策可能存在重大差异。推荐的强度是可指导行为的:弱推荐表明参与共同决策制定过程非常重要,而强推荐则表明通常不需要给出两种选择。

如果证据的确定性较低,理想与不理想的结果间存在密切的平衡,患者的价值观和意愿差异很大或存在不确定性,或者干预措施需要相当多的资源,则推荐更有可能是弱推荐,而不是强推荐。在关于由 GRADE Evidence to Decision框架的 BMJ 系列报告 [18, 19] 和最初的系列报告 [2, 20] 中,已有全面的讨论。

作者: Reed Siemieniuk and Gordon Guyatt

 

阅读更多相关信息

参考文献

  1. Guyatt GH, Oxman AD, Kunz R, Vist GE, Falck-Ytter Y, Schunemann HJ. What is “quality of evidence” and why is it important to clinicians? BMJ (Clinical research ed). 2008;336(7651):995-8.
  2. Guyatt GH, Oxman AD, Vist GE, Kunz R, Falck-Ytter Y, Alonso-Coello P, et al. GRADE: an emerging consensus on rating quality of evidence and strength of recommendations. BMJ (Clinical research ed). 2008;336(7650):924-6.
  3. Guyatt G, Oxman AD, Akl EA, Kunz R, Vist G, Brozek J, et al. GRADE guidelines: 1. Introduction-GRADE evidence profiles and summary of findings tables. Journal of clinical epidemiology. 2011;64(4):383-94.
  4. Guyatt GH, Oxman AD, Kunz R, Atkins D, Brozek J, Vist G, et al. GRADE guidelines: 2. Framing the question and deciding on important outcomes. Journal of clinical epidemiology. 2011;64(4):395-400.
  5. Balshem H, Helfand M, Schunemann HJ, Oxman AD, Kunz R, Brozek J, et al. GRADE guidelines: 3. Rating the quality of evidence. Journal of clinical epidemiology. 2011;64(4):401-6.
  6. Guyatt G, Oxman AD, Sultan S, Brozek J, Glasziou P, Alonso-Coello P, et al. GRADE guidelines: 11. Making an overall rating of confidence in effect estimates for a single outcome and for all outcomes. Journal of clinical epidemiology. 2013;66(2):151-7.
  7. Mustafa RA, Santesso N, Brozek J, Akl EA, Walter SD, Norman G, et al. The GRADE approach is reproducible in assessing the quality of evidence of quantitative evidence syntheses. Journal of clinical epidemiology. 2013;66(7):736-42; quiz 42.e1-5.
  8. Guyatt GH, Oxman AD, Vist G, Kunz R, Brozek J, Alonso-Coello P, et al. GRADE guidelines: 4. Rating the quality of evidence–study limitations (risk of bias). Journal of clinical epidemiology. 2011;64(4):407-15.
  9. Higgins JP, Altman DG, Gøtzsche PC, Jüni P, Moher D, Oxman AD, et al. The Cochrane Collaboration’s tool for assessing risk of bias in randomised trials. BMJ (Clinical research ed). 2011;343:d5928.
  10. Wells G, Shea B, O’connell D, Peterson J, Welch V, Losos M, et al. The Newcastle-Ottawa Scale (NOS) for assessing the quality of nonrandomised studies in meta-analyses. Ottawa: Ottawa Hospital Research Institute; 2011. oxford. asp; 2011.
  11. Sterne JA, Hernan MA, Reeves BC, Savovic J, Berkman ND, Viswanathan M, et al. ROBINS-I: a tool for assessing risk of bias in non-randomised studies of interventions. BMJ (Clinical research ed). 2016;355:i4919.
  12. Guyatt GH, Oxman AD, Kunz R, Brozek J, Alonso-Coello P, Rind D, et al. GRADE guidelines 6. Rating the quality of evidence–imprecision. Journal of clinical epidemiology. 2011;64(12):1283-93.
  13. Walsh M, Srinathan SK, McAuley DF, Mrkobrada M, Levine O, Ribic C, et al. The statistical significance of randomized controlled trial results is frequently fragile: a case for a Fragility Index. Journal of clinical epidemiology. 2014;67(6):622-8.
  14. Guyatt GH, Oxman AD, Kunz R, Woodcock J, Brozek J, Helfand M, et al. GRADE guidelines: 7. Rating the quality of evidence–inconsistency. Journal of clinical epidemiology. 2011;64(12):1294-302.
  15. Guyatt GH, Oxman AD, Kunz R, Woodcock J, Brozek J, Helfand M, et al. GRADE guidelines: 8. Rating the quality of evidence–indirectness. Journal of clinical epidemiology. 2011;64(12):1303-10.
  16. Guyatt GH, Oxman AD, Montori V, Vist G, Kunz R, Brozek J, et al. GRADE guidelines: 5. Rating the quality of evidence–publication bias. Journal of clinical epidemiology. 2011;64(12):1277-82.
  17. Guyatt GH, Oxman AD, Sultan S, Glasziou P, Akl EA, Alonso-Coello P, et al. GRADE guidelines: 9. Rating up the quality of evidence. Journal of clinical epidemiology. 2011;64(12):1311-6.
  18. Alonso-Coello P, Schunemann HJ, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, et al. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 1: Introduction. BMJ (Clinical research ed). 2016;353:i2016.
  19. Alonso-Coello P, Oxman AD, Moberg J, Brignardello-Petersen R, Akl EA, Davoli M, et al. GRADE Evidence to Decision (EtD) frameworks: a systematic and transparent approach to making well informed healthcare choices. 2: Clinical practice guidelines. BMJ (Clinical research ed). 2016;353:i2089.
  20. Guyatt GH, Oxman AD, Kunz R, Falck-Ytter Y, Vist GE, Liberati A, et al. Going from evidence to recommendations. BMJ (Clinical research ed). 2008;336(7652):1049-51.