为什么研究证据比专家个人意见更好?

广义上讲,为了确定事实和得出结论,进行的任何形式的系统性观察都可以作为研究证据。任何不符合这一定义的内容通常都被归为“专家意见”,它是基于处理患者的经验、对生物学的理解、对临床前期研究的了解以及研究结果。有证据表明,使用专家意见作为决策的唯一依据存在问题,因为在实践中,某些新的治疗在被证明有效之前,医生经常会过早地引入该疗法,或者不能及时引入已证明有效的疗法。

然而,临床经验是解读和在实践中应用研究证据以及形成推荐(例如在临床指南中)的关键。换句话说,研究证据是必要的,但不足以做出良好的健康相关决策。

哪些研究更可靠

并非所有的证据都是可靠的。

任何从个体或人群收集数据的定性或定量研究,通常被称为原始研究。有许多的原始研究设计类型,但对于每种类型的健康问题而言,某种设计类型的研究可以提供更可靠的信息。

对于治疗决策,有共识认为,最可靠的原始研究是随机对照临床试验 (randomised controlled trial, RCT)。在这种类型的研究中,患者被随机分配到各组,接受需要验证的治疗措施,或者接受比较组的治疗措施(有时被称为对照治疗措施)。随机表示真正的随机。将某人纳入某一组或另一组的决定就像通过抛硬币决定一样:正面的分为一组,反面的分为另一组。

对照治疗措施可能是一种不同类型的治疗方法,或者是一种不应有任何效果的虚拟治疗(安慰剂)。然后研究人员比较不同治疗措施的效果。

大型随机临床试验花费大且耗时。此外,有时在进行一项研究时,一些人被随机分配到不治疗组,这可能是不符合伦理的。例如,对一些哮喘发作的儿童提供氧气,而对另一些则不提供,这种做法是不正确的。在这种情况下,其他的原始研究设计可能是最好的选择。

实验室研究是另一种类型的研究。报纸上经常报道关于一种药物如何治愈小鼠癌症的研究。但是,一种治疗方法在实验中对动物起效,并不意味着它会对人体起作用。事实上,大多数经证明能够治愈小鼠癌症的药物,对人类没有疗效。

仅在很少情况下,我们不能根据研究结果来做出医疗健康决策。有时医生习惯以一种似乎有效的方式治疗疾病,因此相关研究尚未开展。在骨折和手术治疗方面,经常如此。但不能仅仅因为没有针对某种治疗的研究,就认为它不起作用。这只是意味着没有人能够下确定的结论。

为什么我们不应该阅读研究?

我们需要付出巨大的精力来确定和总结与医疗健康干预相关的所有已知知识。信息量已急剧增加。据保守估计,每年有超过 35,000 种医学期刊和近 2000 万篇研究论文发表。另一方面,多达一半的已有数据可能尚未发表。

谁能跟上这样的更新速度?您如何知道一个研究是否优质?每一项原始研究只是一张拼图的一部分,而此拼图可能需要数年才能完成。任何一项单独的研究都很难回答医生或患者的问题。

尽管阅读大量的研究不切实际,但高质量的原始研究(特别是 RCT)是我们知识来源的基础,也是扩充知识的最好方式。任何支持或促进去开展健全、透明和独立临床试验的努力都是值得支持的,通常这些试验应完整、清晰地进行发表。关于这方面有一个重要的项目,即All trials倡议。

为什么我们应该阅读系统评价?

大多数情况下,一项单独的研究并不能告诉我们足够的信息。通过把许多研究的结果合并起来,可以找到最佳答案。

系统评价是一种类型的研究,它着眼于所有高质量研究的结果。它将这些独立研究的结果进行汇总。它给出了对治疗风险和获益的估计。有时这些评价包含一种统计学分析,被称为mate-分析,其通过合并若干个研究的结果来评估治疗效果。

系统评价越来越多地用于决策制定,因为它们降低了被一块“拼图”误导的可能性。通过系统化整理,它们也更加透明,并成为整合不断增加、不一致的生物医学文献的金标准方法。

系统评价并非万无一失,其结果的质量取决于它所纳入的原始研究和所使用的方法。但是最佳的评价会清楚地阐述其所纳入的研究是否具有良好的质量。

我们不应该阅读(大部分)系统评价的三个原因

首先,随着时间的推移,系统评价的数量急剧增长。从 2010 年的每天 11 篇猛然增长到 2015 年的每天 40 篇或更多[1][2]。一些人将这种产出描述为已经达到了“流行病的程度”,即绝大多数的系统评价和 meta 分析是非必需的、具有误导性的和/或不一致的[3][4]。因此,对于一个问题找到不止一篇系统评价比找不到系统评价的情况更常见,并且对于最热门的问题,找到几十篇系统评价并不罕见。

其次,大多数系统评价阐述的问题范围较窄,在评估个体病例的所有可用替代方案的情况下,很难应用这些评价。阅读多篇系统评价来评估所有不同的方案是不切实际的,并且我们认为对于每天需要解决数个问题的临床医生来讲,通常难以理解系统评价[5]。

第三,针对一名特定的患者或者一种特定的情况,系统评价并不能告诉您怎么做或者建议您怎么做。实际上,好的系统评价应明确避免提出建议。

因此,虽然在任何循证决策过程中,系统评价起着关键作用,但是它们中的大多数都是低质量或过时的,而且它们很少能为现实世界中的决策提供所需的所有信息。

如何找到最佳证据?

在考虑获取大量可用的信息时,我们可以迅速放弃将定期回顾最喜欢的期刊作为寻找最佳可用证据的方法。

寻找证据的传统方法通常是使用主流数据库,例如PubMedEMBASE。这些数据库由多种来源构成,涵盖了上百万的相关或不相关的论文。尽管在过去它们是寻找证据的首选方法,但信息超载使它们变得不适于实际操作,并且大多数临床医生无论多么努力,都无法通过这种方法找到最佳证据。

另一种流行的方法是仅在 Google 中检索。遗憾的是,由于缺乏透明度,Google 无法可靠地从未经证实或非科学监督的资料来源中筛选出现有的最佳证据 [6]。

找到最佳证据的三种选择方式?

选择方式一 ——挑选最佳系统评价

掌握识别、评价和应用高质量系统评价的技巧,并将其用于实践是非常有益的。这并非一件容易的事,不过一旦掌握,就能获得更广阔的视角:关于什么是已知的,什么是未知的。

Cochrane 协作网是以一位著名研究者的名字命名的国际组织,是最高质量系统评价唯一的最佳来源[4]。您可以通过The Cochrane Library网站进行访问。

不幸的是,Cochrane 系统评价并没有涵盖现存的所有问题,或者它们并非总是最新的。同时,可能有非 Cochrane 系统评价优于 Cochrane 系统评价的情况。

有许多资源可以帮助您获取系统评价(以及其他资源),例如Trip数据库PubMed HealthACCESSSS或Epistemonikos。

Epistemonikos数据库具有创新性,因为它既能同时搜索多种资源,又能索引和链接相关的证据。例如,Epistemonikos 将系统评价和该评价纳入的研究进行链接,从而使基于共同原始研究的系统评价汇集在一起。Epistemonikos 能够提供可视化的多语言用户界面、多语种检索以及超过 9 种语言的摘要翻译,在这些方面,该数据库是独一无二的[6]。该数据库还包括一些用于比较系统评价的工具,包括证据矩阵 (matrix of evidence),这是一种可以显示所有系统评价及其纳入的原始研究的动态表格。

此外,在 2017 年,Epistemonikos与Cochrane进行了合作,发布了 Cochrane Library和Epistemonikos的联合检索。

选择方式二——阅读可信赖的指南

虽然系统评价可以提供关于干预措施的获益和危害的综合评估,但它们不能将这些因素与患者的价值观、意愿或资源等考虑因素结合起来,进而提供建议的做法。此外,为了充分解决这些问题,临床医生需要将覆盖所有相关的替代方案和结局的系统评价的信息整合起来。大多数临床医生可能更喜欢指南,而不喜欢解读系统评价本身。

值得信赖的指南,特别是当其制定过程采用高标准(例如推荐分级的评估、制定与评价 [Grading of Recommendations, Assessment, Development and Evaluations, GRADE])时,能在从证据到推荐方面提供系统且透明的指导 [7]。

许多在线指南网站都标榜自己是“循证的”,但很少给出研究结果的链接[8]。如果指南没有在行列列出相关研究结果的参考文献,那么就应将其排除。如果它们有在线引用,您可以判断支持推论的证据强度,检查它们是否使用了上述选择方式一中的高质量证据(相较于低质量证据)。

遗憾的是,大多数指南存在严重的局限性,或者已经过时[9][10]。确定和评价最佳指南的做法比较耗时。对于解决源自不同情况或疾病问题的全科医生,这尤其具有挑战性。

选择方式三——使用即时诊疗 (point-of-care) 工具

为了满足实际需求,已经开发出一些即时诊疗工具(例如 BMJ Best Practice),这些工具总结了关于越来越多替代方案不断增加的生物医学文献,从而做出循证决策。在这个竞争激烈的市场中,更成功的产品是那些具有创新性、用户友好界面的产品,这些用户友好界面可以改善对临床实践中许多不同领域内容的检索、合并、组织和应用。

然而,对于指南而言,在不牺牲质量的情况下追求新证据是不可能的,对于即时诊疗工具,同样如此。临床医生应对他们想要获取或可以访问的即时诊疗信息资源变得熟悉,还应检查相关研究结果所对应的参考文献。通过检查声明是基于高质量证据还是低质量证据(如选择方式一所述),临床医生可以很容易地判断证据力度。在选择即时诊疗信息总结时,要记住的其他特征包括全面性、GRADE 方法的使用和独立性。

Kwag等在一项研究中提供了一份关于这些资源的完整列表。

未来的发展

找到最佳可用证据比启动循证相关行动更具挑战性,其主要原因在于上述各种“循证”信息均呈指数增长。

然而,有一点儿耐心和实践的忙碌的临床医生就会发现,现在实施循证实践比 5 年或 10 年前容易得多。我们进入了一个信息在不同系统之间流动的时期,在这一时期,技术可以很好地被利用,不同的参与者开始进行合作。

早期采纳者肯定会喜欢以下资料(仅列出部分资料)的第一次实验:现存的系统评价(关于医疗健康研究最新的高质量在线总结摘要,随着新研究的发布而得到更新)、现存的指南以及附有快速推荐的快速评价[13][14][15]。

在可预见的未来,存在无数低质量的研究和评价的情况不太可能发生变化。然而,如果在未来 3-5 年内,将小麦从谷壳中分离出来变得微不足道,也不会令人感到奇怪。针对更有效、更安全的医学干预措施的循证医学将改善医疗健康结局的这一承诺可能会兑现。

作者:Gabriel Rada

竞争利益:Gabriel Rada 是 Epistemonikos 数据库的联合创始人和主席,是 PDQ-Evidence 创建和维护团队的成员,也是Cochrane 协作网的一名编辑。

相关文章

Living Systematic Reviews: towards real-time evidence for health-care decision-making

 

参考文献

  1. Bastian H, Glasziou P, Chalmers I. Seventy-five trials and eleven systematic reviews a day: how will we ever keep up? PLoS Med. 2010 Sep 21;7(9):e1000326. doi: 10.1371/journal.pmed.1000326
  2. Epistemonikos database [filter= systematic review; year=2015]. A Free, Relational, Collaborative, Multilingual Database of Health Evidence. https://www.epistemonikos.org/en/search?&q=*&classification=systematic-review&year_start=2015&year_end=2015&fl=14542 Accessed 5 Jan 2017.
  3. Ioannidis JP. The Mass Production of Redundant, Misleading, and Conflicted Systematic Reviews and Meta-analyses. Milbank Q. 2016 Sep;94(3):485-514. doi: 10.1111/1468-0009.12210.
  4. Page MJ, Shamseer L, Altman DG, et al. Epidemiology and reporting characteristics of systematic reviews of biomedical research: a cross-sectional study. PLoS Med. 2016;13(5):e1002028.
  5. Del Fiol G, Workman TE, Gorman PN. Clinical questions raised by clinicians at the point of care: a systematic review. JAMA Intern Med. 2014 May;174(5):710-8. doi: 10.1001/jamainternmed.2014.368.
  6. Agoritsas T, Vandvik P, Neumann I, Rochwerg B, Jaeschke R, Hayward R, et al. Chapter 5: finding current best evidence. In: Users’ guides to the medical literature: a manual for evidence-based clinical practice. Chicago: MacGraw-Hill, 2014.
  7. Guyatt GH, Oxman AD, Vist GE, et al. GRADE: An emerging consensus on rating quality of evidence and strength of recommendations. BMJ. 2008;336(7650):924-926. doi: 10.1136/bmj.39489.470347
  8. Neumann I, Santesso N, Akl EA, Rind DM, Vandvik PO, Alonso-Coello P, Agoritsas T, Mustafa RA, Alexander PE, Schünemann H, Guyatt GH. A guide for health professionals to interpret and use recommendations in guidelines developed with the GRADE approach. J Clin Epidemiol. 2016 Apr;72:45-55. doi: 10.1016/j.jclinepi.2015.11.017
  9. Alonso-Coello P, Irfan A, Solà I, Gich I, Delgado-Noguera M, Rigau D, Tort S, Bonfill X, Burgers J, Schunemann H. The quality of clinical practice guidelines over the last two decades: a systematic review of guideline appraisal studies. Qual Saf Health Care. 2010 Dec;19(6):e58. doi: 10.1136/qshc.2010.042077
  10. Martínez García L, Sanabria AJ, García Alvarez E, Trujillo-Martín MM, Etxeandia-Ikobaltzeta I, Kotzeva A, Rigau D, Louro-González A, Barajas-Nava L, Díaz Del Campo P, Estrada MD, Solà I, Gracia J, Salcedo-Fernandez F, Lawson J, Haynes RB, Alonso-Coello P; Updating Guidelines Working Group. The validity of recommendations from clinical guidelines: a survival analysis. CMAJ. 2014 Nov 4;186(16):1211-9. doi: 10.1503/cmaj.140547
  11. Kwag KH, González-Lorenzo M, Banzi R, Bonovas S, Moja L. Providing Doctors With High-Quality Information: An Updated Evaluation of Web-Based Point-of-Care Information Summaries. J Med Internet Res. 2016 Jan 19;18(1):e15. doi: 10.2196/jmir.5234
  12. Banzi R, Cinquini M, Liberati A, Moschetti I, Pecoraro V, Tagliabue L, Moja L. Speed of updating online evidence based point of care summaries: prospective cohort analysis. BMJ. 2011 Sep 23;343:d5856. doi: 10.1136/bmj.d5856
  13. Elliott JH, Turner T, Clavisi O, Thomas J, Higgins JP, Mavergames C, Gruen RL. Living systematic reviews: an emerging opportunity to narrow the evidence-practice gap. PLoS Med. 2014 Feb 18;11(2):e1001603. doi: 10.1371/journal.pmed.1001603
  14. Vandvik PO, Brandt L, Alonso-Coello P, Treweek S, Akl EA, Kristiansen A, Fog-Heen A, Agoritsas T, Montori VM, Guyatt G. Creating clinical practice guidelines we can trust, use, and share: a new era is imminent. Chest. 2013 Aug;144(2):381-9. doi: 10.1378/chest.13-0746
  15. Vandvik PO, Otto CM, Siemieniuk RA, Bagur R, Guyatt GH, Lytvyn L, Whitlock R, Vartdal T, Brieger D, Aertgeerts B, Price S, Foroutan F, Shapiro M, Mertz R, Spencer FA. Transcatheter or surgical aortic valve replacement for patients with severe, symptomatic, aortic stenosis at low to intermediate surgical risk: a clinical practice guideline. BMJ. 2016 Sep 28;354:i5085. doi: 10.1136/bmj.i5085