3本词汇表提供了常用的循证医学术语的定义和释义。(按英文首字母排序)

A

绝对风险 (Absolute risk, AR)

在一定时期内,个体发生特定结局的概率。取值范围为 0 到 1,或以百分比表示。与常用用法不同,“风险” (risk) 一词可以指不良事件(例如心肌梗死)或预期的事件(例如治愈)。

绝对风险增加 (Absolute risk increase, ARI)

在临床试验中,试验组与对照组之间风险的绝对差值。当试验组的风险超过对照组时使用。用试验组的绝对风险减去对照组绝对风险来计算。这个数字并不能说明两组间风险性的增加比例,因此,需要使用相对风险 (relative risk, RR) 这个指标。

绝对风险降低 (Absolute risk reduction, ARR)

在临床试验中试验组和对照组之间风险的绝对差值。当对照组的风险超过试验组时使用,用对照组的绝对风险减去试验组的绝对风险来计算。这个数字并不能说明两组间风险按比例下降。因此,需要相对风险 (relative risk, RR) 这个指标。

分配隐藏 (Allocation concealment)

一种通过隐藏待分配受试者纳入干预组的分配顺序以避免选择性偏倚的方法。分配隐藏可防止研究者(无意识地或以其他方式)影响受试者的入组分配。

适用性 (Applicability)

临床试验的结果是否可应用于个体。一项随机临床试验仅提供该特定临床试验范围内因果关系的直接证据。将这个结果应用于特定个体需要额外的逻辑步骤。个体特征会影响个体的结局。

参与医疗卫生决策制定的人员必须考虑到相关的个体因素(例如受试者特征)。另参见可推广性 (generalisability)。

 

B

基线风险 (Baseline risk)

在没有积极治疗情况下的事件发生风险。依据对照组的基线风险来进行估计。基线风险对评估治疗的潜在获益非常重要。基线风险较高的患者可能有更大的潜在获益。

最佳证据 (Best evidence)

针对随机对照临床试验 (randomized controlled trial, RCT) 的系统评价或单项 RCT 是表明治疗性干预效果的最佳方法,因为无论是支持治疗还是不支持治疗,其研究设计均能减小偏倚。

但是有时候,其他证据足以证明因果关系,在这种情况下进行 RCT 就不符合伦理。在一些其他情况下,进行 RCT 是不切实际的。在以下情况下,RCT 无法充分解答临床问题:

  • 有充分的理由认为干预措施不可能获益或可能有害
  • 结局非常罕见(例如,1/10,000 的致命性不良反应)
  • 情况非常罕见
  • 需要特别长时间的随访(例如,青少年喝牛奶能否预防老年骨折?)
  • 从观察性研究中获益的证据很明显(例如,氧气治疗急性哮喘发作)
  • 当将证据应用于实际的临床环境时(外部有效性)
  • 目前的临床实践方式很难改变和/或患者不愿意接受对照治疗或积极治疗
  • 随机化的单位太大(例如全国公共卫生运动)
  • 病情严重,需要立刻治疗。其中只有第一种情况是明确的。在其他情况下,关于不适合进行 RCT 的临界点没有精确的定义。

偏倚 (Bias)

由于开展研究的方式不同,导致研究结果与其对患者产生的“真实”结果/效应有系统偏差。

盲法 (Blinding/blinded)

如果临床试验涉及的所有人都不知道受试者被分配到哪个治疗组,直到结果分析阶段才能知道,那么该试验就是全盲的。试验涉及的所有人包括受试者、给予治疗和记录临床试验结果的每个人。理想情况下,试验应该检验受试者是否知晓自己被分配到哪一组。这一点就尤其重要,例如,如果其中一种治疗独具特色或有特别的不良反应。遗憾的是,这种检验很少见。在文献中,使用单盲或双盲术语很常见,但使用情况却不一致。

区组随机化 (Block randomisation)

通过一种模式进行随机化,使得每组分配到所需数量的人。

 

C

病例对照研究 (Case-control study)

一种研究设计,它对一组经历过一种事件(通常是不良事件)的人和一组没有经历过相同事件的人进行评估,研究这两组患者在暴露于可疑(通常是有害的)因素方面的差异。这种类型的研究设计对确定罕见事件(例如罕见的癌症)的原因是最有帮助的。

病例对照研究只能产生比值比 (odds ratios, OR) 而不能产生相对风险 (RR)。病例对照研究提供的证据比队列研究弱,但是比病例系列研究的证据更可靠。

病例系列研究 (Case series)

分析一系列患病人群(病例系列研究没有对照组)。病例系列研究提供的证据比病例对照研究

弱。

整群随机化 (Cluster randomisation)

整群随机研究是指一组受试者被一起随机分配至接受相同干预措施的研究。整群随机化的例子包括将同一个村庄、医院或学校的人员分配在一起。如果结果是针对个体而不是整个群体来进行分析,就会出现偏倚。

随机化单位应与分析单位相同。通常一项整群随机对照试验回答不同于个体随机研究的问题。 在村庄或初级医疗保健实践层面的干预措施很可能与患者个体层面的干预措施产生不同的影响。因此,试图通过考虑组内相关系数或其他方法来进行弥补可能是不恰当的。

队列研究 (Cohort study)

一种非实验性的研究设计,随访一群人(一个队列),然后观察组内人员发生的事件有何差异。一项评估队列(该队列暴露于一些不同的可疑风险因素 [例如吸烟])的研究对确定暴露因素是否可能导致特定事件(例如肺癌)是有用的。前瞻性队列研究(及时追踪受试者将来的情况)比回顾性队列研究更可靠。

完整病例分析 (Completer analysis)

仅对研究结束时仍存在的受试者的数据进行分析。相较于意向性治疗分析,后者使用所有入组受试者的数据。

可信区间 (confidence interval, CI)

95% 可信区间(或称95%置信界限)包含 95% 的针对同一人群、具有同样大小和设计的研究结果。95% 可信区间接近但不等同于“真实的效应量(从来也不可能精确地知道)有 95% 的可能性处于该可信区间内”这一说法。如果相对风险 (RR) 或比值比 (OR) 的 95% 可信区间跨越1,则认为没有证据表明是有效的。可信区间(而不是P值)的实际优势在于它能提供可能效应量的范围。

对照临床试验 (controlled clinical trial, CCT)

临床试验的受试者被分配至两个或更多的不同治疗组。这个术语通常指治疗按照随机分配方法以外的方法进行治疗分配的对照试验。如果分配方法是通过随机选择进行的,那么这种研究被称为随机对照临床试验 (RCT)。非随机对照试验比 RCT 更容易受偏倚的影响。

对照 (Controls)

在随机对照临床试验 (RCT) 中,对照是指对照组的受试者。将他们分配至安慰剂组、无治疗组或者标准治疗组。将对照组所用试剂的性质说明很重要,因为干预组和对照组之间可能存在影响结果的相互作用。例如,如果“对照”具有可能的疗效(例如将盐水用于眼部感染)。

相关系数 (Correlation coefficient)

评估相关性的一种方法,表明两个变量以线性关系共同变化的程度。相关系数用 r 表示,在 -1 和 +1 之间变化。当 r 是+1时,表示完全的正相关关系(当一个变量增加时,另一个变量增加,且比例保持不变)。当 r 为 -1 时,表示完全的负性关系(当一个变量增加,另一个减少,反之亦然,且比例保持不变)。然而,这不排除其他的相关关系;因为其只排除了一种线性关系。

交叉随机试验 (Crossover randomised trial)

在临床试验中,对受试者进行一种治疗并评估结局,然后进行另一种治疗,并再次评估结局。治疗顺序是随机分配的。有时在临床试验开始之前和两种治疗之间的一段时间不进行治疗(洗脱期),以尽量减少两种治疗间的干扰(延滞效应)。对交叉随机试验结果的解读可能较复杂。

横断面研究 (Cross-sectional study)

一种研究设计,在某一时点对人群的暴露情况、疾病或两者进行调查研究。它可以用于评估在人群中某种疾病的患病率。不应将横断面研究用于评估某种治疗的因果关系。

 

D

数据合并 (Data pooling)

原始数据不加权重的粗略总和。这与 meta 分析不同。

伤残调整生命年 (disability-adjusted life year, DALY)

评估疾病负担的一种方法,其目的是用一个单一的数字量化疾病、危险因素或治疗所损失或获得的生命数量和质量。DALY 函数的损失或获得计算方法为:特定健康状态下的预期生命年数,乘以依据该状态下经历的残疾所确定的系数(从0 [健康状况最佳] 到1 [死亡])。之后的年数以每年减少 3% 的比例进行折算,儿童和老年人的权重更小。

可回溯性 (drillability)

是指将结论陈述从最简明的形式追溯到支持它的原始证据的能力。这不仅仅要求数据,而且所有用于产生简明形式的方法,都是明确的且可重复的。

 

E

效应量 (Effect size)

在医学文献中,效应量是指各种疗法的治疗效应大小。

术语“效应量”通常是指标准化均数差 (standardised mean difference, SMD):一项用于合并连续性变量(例如疼痛评分或身高)的统计数据(采用不同的量表获得),通过将两个平均值的差除以组内标准差的估计值来计算。

标准化均数差是非常难以解读的,因为合并异质性的量表以牺牲临床可理解性为代价来提供统计精确性。

事件 (Event)

研究中所探索的二分类结局事件(例如心肌梗死、死亡或疼痛评分改善 4 分)的发生。

事件发生率 (Event rates)

在确定临床试验的效力时,事件发生率与受试者的数量同样重要。如果事件发生率极低,即使在一个非常大型的临床试验中,也可能没有足够的事件来发现治疗组与对照组之间结果的差异。

实验性研究 (Experimental study)

在研究者控制的条件下,探究有意识地改变一种或多种因素所带来影响的研究。

外部有效性(可推广性)(External validity / generalisability)

一项试验结果在该试验之外的有效性。

随机对照临床试验 (RCT) 仅提供该临床试验中因果关系的直接证据。推广应用这个结果需要一个额外的逻辑步骤。然而,实际上,有必要假设结果是可普遍适用的,除非有相反的证据。如果证据在不同环境和不同人群(例如,不同年龄和国家)之间是一致的,那么有证据支持外部有效性。 如果只有来自不典型机构的证据(例如,在教学医院,当大多数病例见于初级医疗保健时),那么应该对结果的可推广性持怀疑态度。可推广性不仅仅是试验纳入要求的结果,还取决于受试者的来源(另参见适用性)。

 

F

析因设计 (Factorial design)

析因设计尝试通过多次随机化的方式在单个试验中评价不止一种干预措施。

假阴性 (False negative)

患有目标疾病(依据金标准确诊)个体的诊断性试验结果为阴性。

假阳性 (False positive)

未患有目标疾病(金标准确诊)个体的诊断性试验结果为阳性。

固定效应 (Fixed effects)

Meta 分析的“固定效应”模型通常不合理地假定,研究之间的变异性完全是由于一个围绕固定效应的随机抽样差异造成的(同时参考随机效应)。

 

H

危害 (Harms)

治疗的不良反应。

循证医疗保健资源在提供高质量的危害证据方面往往非常困难。大多数随机对照临床试验 (RCT) 没有相关设计来充分评估不良反应:样本量太小、试验时间太短、经常没有系统性收集有关不良反应的信息。很多危害数据通常是以无对照的病例报告形式出现。由于接受干预措施的人数不同、基线风险不同、报告不同,比较这些系列数据是困难的。最佳证据来自关于危害数据的系统评价,它尝试合并不同来源的数据资料。然而,这并不总是可行的。其他危害的证据可包括关于干预措施是否由于危害的风险而被监管机构禁止或撤回的信息。

风险比 (hazard ratio, HR)

大体上等于相对风险 (RR);当风险相对于时间不恒定时,是有用的。它使用在不同时间收集的信息。该术语通常用于随时间推移的生存分析。如果 HR 是 0.5,那么在一个群体中死亡的相对风险是另一个群体死亡风险的一半。

HR 比 RR 考虑的数据更多,在评估慢性病或长期后遗症时特别有效。

异质性 (Heterogeneity)

在 meta 分析中,异质性意味着研究之间的差别。这可能是因为使用不同的统计方法(统计学异质性),或者评价的是有不同特征、治疗或结局(临床异质性)的人群。异质性可能使 meta 分析中合并的数据变得不可靠或不适用于此。没有发现重要的异质性证据与找到无异质性的证据是不一样的。如果研究的数量少,异质性可能会影响结果,但不具有统计学意义。

同质性 (Homogeneity)

相似性(参见异质性)。

 

I

发病率 (Incidence)

在特定时期内某一人群中发生的新病例数。

 

L

末次观测值结转 (last observation carried forward, LOCF)

一种管理受试者从临床试验中退出,并允许直到退出研究之前关于患者进展的数据能够被纳入到结果分析的一种方法。例如,假设在患者基线观察后的 8 周期间,每周进行评价。如果患者在第 3 周后退出研究,那么这个值就是“结转”,并假设这是他或她的 5 个缺失数据点的分数,直到试验结束。该假设认为患者从研究开始到结束逐渐改善,因而结转的中间值是保守估计这个人如果留在研究中的可能结果。这种方法有明显的局限性,因为患者接受治疗或使用安慰剂的效果通常并非呈线性,但是它确实允许对更多的数据进行分析,这就增加了试验检测出组间差异的效力。

似然比 (Likelihood ratio)

具有目标疾病的个体得到指定检验结果的概率,与没有目标疾病的个体得到相同指定检验结果概率的比值。

 

M

Meta 分析 (Meta-analysis)

一种使用单一加权估计、汇总若干研究结果的统计学技巧,其中,发生更多事件的研究和具有更高质量的研究被赋予相对更多的权重。

Meta 分析通常是指用于整合临床试验数据的定量分析方法(通常涉及权重)。这与系统评价在逻辑上明显不同。系统评价是通过对文献进行明确的系统检索和评价来定义的,可以有或者没有对数据的 meta 分析。Meta分析也不同于单纯基于原始数据的数据合并。

疾病率 (Morbidity)

疾病的比率,不是死亡的比率。

死亡率 (Mortality)

死亡的比率。

 

N

阴性似然比 (negative likelihood ratio, NLR)

患有目标疾病个体的检验结果为阴性的概率,与未患目标疾病个体的检验结果为阴性的概率的比值。

阴性预测值 (negative predictive value, NPV)

诊断性试验结果阴性时未患疾病的可能性(不要与特异性相混淆,后者含义正相反)。

非系统评价 (Non-systematic review)

一篇综述或 meta 分析没有对相关临床问题进行全面的文献检索,仅纳入了一部分研究,或者没有说明检索和评价所纳入研究的方法。

不显著 (not significant/non-significant, NS)

不显著通常意味着没有统计学意义。在统计学术语中,这意味着观察到的差异或更大的差异可能偶然出现概率大于 1/20(即 5%)的情况,不过假定没有根本区别。这与没有效应的说法不同,只是这个试验没有提供令人信服的证据。这可能是因为试验没有效力去发现确实存在效应,出于无效或者巧合。

需要伤害的患者数 (number needed to harm, NNH)

一种评估治疗措施所带来危害的方法。在特定的时间内,进行某种干预治疗引起一个额外不良结局所需治疗的平均人数。

需要治疗的患者数 (number needed to treat, NNT)

评估治疗效果的一种方法。在特定的时间段内,为防止一个额外的不良结局或获得一个额外的有益结局,需要接受某种干预治疗的平均人数。NNT 容易解读,但只能在一定基线风险水平的基础上进行应用。此外,由于难以解读不显著结果的可信区间,只在有显著效果时提供 NNT。不显著的可信区间从 NNT 到 NNH 跨越无穷大,而不是零。

Meta 分析中 NNT 的应用 (NNT for a meta-analysis)

在描述获益所需的努力时,绝对评估指标是有用的,但由于受到治疗和个体基线风险的影响,所以是有限的。如果 meta 分析纳入一系列具有不同基线风险的个体,那么需要治疗的患者数 (NNT) 不适用于在该 meta 分析中的人群,但如果没有异质性,则单一的相对指标(比值比或相对风险)可能适用。

 

O

观察性研究 (Observational studies)

在一项观察性研究中,观察个体或评估特定结局,并不会尝试影响结局(例如不治疗)。观察性研究为了解预后、病因和发病率/患病率提供了最合适的证据形式。但是,这些研究不能证明因果关系。观察性研究的常见类型包括横断面研究、病例对照研究和队列研究。

比值 (odds)

事件发生的比值定义为该事件发生的概率,表达形式为事件发生的概率与事件不会发生概率之间的比值。

比值比 (odds ratio, OR)

量化治疗效果的一种方法。试验组事件发生比值与对照组事件发生比值的比率。OR 值越接近 1,试验干预与对照干预的效果差异越小。如果 OR 值大于(或小于) 1,则治疗的效果比对照治疗更大(或更小)。请注意,量化的效果可能是不利的(例如死亡或残疾)或合适的(例如生存)。当事件罕见时,OR 值与相对风险 (RR) 相似,但随着事件发生率增加,OR 值和 RR 值出现偏离。

比值降低 (Odds reduction)

比值比的补充,当事件罕见时,与相对风险降低 (relative risk reduction, RRR) 相似。

结局 (Outcomes)

治疗有效或无效的指标,例如死亡率、疾病率、生活质量、工作能力、疼痛等。最好避免实验室结局。即使实验室结局指标与临床结局之间有很密切的关系,在临床实践中也并非必然成立。当采用具有临床重要性、以患者为中心的指标作为结局时,经常称为替代结局(例如,丙氨酸氨基转移酶 [alanine aminotransferase, ALT] 浓度是对乙酰氨基酚过量使用后肝损伤的替代结局)。

 

P

个人通讯 (Personal communication)

通常用来指从已发表文章的作者手中直接获得未发表的数据,作为他们发表数据的解释。

PICOt

人群、干预措施、比较和结局都有时间因素 (population, intervention, comparison, and outcome, all with a time element, PICOt)。目前对系统评价的报告要求是:有多少项随机对照临床试验 (RCTs),每个试验有多少名受试者,什么样的干预措施进行比较,什么类型的人,以及何种结局。每个变量都需要有时间因素(受试者的年龄大小、进行多久的治疗、何时进行结局评估)。

安慰剂 (Placebo)

在临床试验中,理想情况下,给予对照组的物质在外观和味道或感觉上应与试验性治疗相同,并且认为该物质对疾病没有任何特异性效果。在进行非药物干预的情况下,安慰剂通常被称为假治疗。与不给予任何治疗不同,安慰剂可以引起实际的生理变化。

阳性似然比 (positive likelihood ratio, LR+)

患有目标疾病的个体试验结果为阳性的概率,与没有目标疾病的个体检验结果为阳性的概率的比值。

阳性预测值 (positive predictive value, PPV)

诊断性试验结果为阳性时患病的几率(不要与敏感度相混淆,敏感度与此恰好相反)。

效力 (Power)

如果一项研究能够可靠地检测出具有临床重要性且确实存在的差异(即两种治疗之间),那么该研究就具有足够的效力。当研究纳入更多事件或者其结局评估指标更精确时,研究的效力会增加。

实用性研究 (Pragmatic study)

旨在提供直接适用于标准临床实践的研究结果的随机对照临床试验(而在解释性临床试验中,旨在阐明理想情况下的效果)。实用性 RCT 招募能代表接受常规治疗的人群,允许有正常的医嘱依从性(避免鼓励性措施,并按照说明书的要求进行口头指导和建议),并依据“意向性治疗”而不是“接受治疗”来分析结果。

患病率 (Prevalence)

在特定时间内,某一特定人群中出现某一发现或某种疾病的人所占比例。

方案 (Protocols)

通常用于描述关于系统评价拟定方案的公开记录的术语。它概括评价旨在解决的临床问题,列出评价对研究的详细纳排标准,并描述作者如何进行严格评价和数据整合。该方案的目的是前瞻性地设定研究目标,并防止根据文献中发现的问题对临床问题进行事后调整,以确保评估仍然是由问题驱动的。

代理结局 (Proxy outcomes)

参考替代结局。

发表偏倚 (Publication bias)

当一个研究能够发表的可能性随研究发现的结果而变化时,会出现发表偏倚。通常情况下,当发现显著效应的研究比未发现显著效应的研究更可能发表时,就会出现这种情况,因此,如果对已发表文献的调查显示治疗效果比真实情况更强,那么就存在发表偏倚。

发表偏倚的出现是因为期刊偏好显著(阳性)结果或者利益团体的选择性发布结果。发表偏倚的常见呈现形式为:不太受关注的试验发表较慢或意义不太突出。

P 值 (P value)

假设干预措施的影响实际上没有真正的差异,所观察到的或更大的差异是偶然发生的概率。如果这个概率小于1/20(当P值小于0.05),那么通常认为结果具有“统计学显著差异”。

 

Q

质量调整生命年 (quality-adjusted life year, QALY)

一种比较健康结局的方法,该方法根据个人当年的健康相关生活质量,给予每个生命年从 1(非常健康)到 0(判断状态相当于死亡)之间的权重。然后将年的总分乘以权重,可以对不同的干预措施进行比较。关于评估健康相关生活质量的最佳方法,目前存在不同的意见。

证据质量 (Quality of evidence)

参见最佳证据。

半随机 (Quasi randomised)

临床试验中,分配受试者接受不同形式诊疗的方法不是真正随机的;例如按出生日期、星期几、病历号、一年中的月份或受试者被纳入研究的顺序(例如交替)进行分配。

 

R

随机效应 (Random effects)

Meta 分析的“随机效应”模型假定每项研究都有不同的潜在效应,并将其作为额外的变异来源进行考虑,这导致比固定效应模型更宽泛的可信区间。假定效应是随机分布的,这种分布的中心点是预估综合效应的重点。

随机效应模型在允许试验异质性方面比固定效应模型更有效,但不能消除由不同试验方法和人群等因素引起的异质性。

随机化 (Randomisation)

一种采用与抛硬币类似的方法,将患者分配到治疗组(如果硬币“正面”朝上,则给予试验性治疗,如果硬币“背面”朝上,则给予传统的“对照”或“安慰剂”治疗)。随机化往往是由

计算机生成的,因为这有助于避免偏倚。

随机对照临床试验 (randomised controlled trial, RCT)

在临床试验中,受试者被随机分配到两组或更多组:至少一组(试验组)接受干预措施,另一组(比较组或对照组)接受替代治疗或安慰剂。这种设计可以评价干预措施的相对效果。

回归分析 (Regression analysis)

如果给出一个因变量和一个或多个自变量的数据,那么回归分析就是建立一个“最佳”数学模型,以根据自变量描述或预测因变量。存在一些适合不同需求的几种回归模型。常见的形式有线性、logistic 和比例风险回归模型。

相对风险 (relative risk, RR)

与另一组相比,在一组中,某一事件发生的可能性更大 (RR >1) 或更小 (RR <1) 的次数。它是每组绝对风险 (AR) 的比值。当事件很少发生时,它与比值比 (OR) 相似。

相对风险的计算方法,干预组的 AR 除以对照组的 AR。可能难以与 OR 区分,OR 是指干预组中事件与非事件的比率,除以对照组中事件与非事件的比率。在美国,比值比有时被称为比率比 (rate ratio) 或相对风险。

相对风险增加 (relative risk increase, RRI)

一项临床试验中试验组和对照组受试者之间的风险成比例增加。

相对风险降低 (relative risk reduction, RRR)

一项临床试验中试验组和对照组受试者之间风险成比例降低。这是相对风险的补充。

 

S

敏感度 (Sensitivity)

患有某种疾病的个体,其诊断性试验得到阳性结果的可能性(不要与阳性预测值 [PPV] 混淆,它们之间恰好相反)。

敏感性分析 (Sensitivity analysis)

检验 meta 分析的结果是否对纳入数据的限制敏感的分析。常见的例子包括:仅大型临床试验、仅较高质量的临床试验、仅较近期的临床试验。如果结果是一致的,那么关于效果和可推广性的证据就更有力。

假治疗 (Sham treatment)

在临床试验中,给予对照组的干预措施,理想情况下,其在外观和感觉上应与试验性治疗相同,并认为该干预对疾病没有任何特异性效应(例如失谐超声 [detuned ultrasound] 或随机生物反馈)。安慰剂用于药片,而假治疗用于设备、心理治疗和物理治疗。

显著性 (Significant)

按照惯例,5% 的水平意味着具有统计学意义。这与 95% 的可信区间相同,不包括相对应的无效值。

特异度 (Specificity)

没有患病者的诊断性试验结果为阴性的几率(不要与阴性预测值 [NPV] 相混淆,两者相反)。

标准化均数差 (standardised mean difference, SMD)

当结局是连续变量(例如身高、体重或症状评分)而不是二分类变量(例如死亡或心肌梗死)时,使用的一种评估效应量的指标。研究组之间结局的平均差异被标准化,以解释评分方法(例如疼痛评分)的差异。该指标是一个比值;因此它没有单位。

SMD 非常难以解读,对异质性量表进行整合,以提供统计学精确性,但牺牲了临床的可理解性。

统计学显著性 (Statistically significant)

意味着一项研究的结果不太可能因偶然而出现。通常显著性以 5% 为标准水平(P <0.05),这意味着在类似的情况下,观察到的差异或更大差异仅有 1/20 几率偶然发生。

亚组分析 (Subgroup analysis)

分析认为效应可能与平均效应不同的部分试验/meta 分析人群。应总是预先设定亚组分析。否则,所提供的分析结果会由于可靠性低而更适合研究假设的生成,导致证据强度弱。如果对相同的数据进行多次检验,则增加了得到虚假效应的可能性,并且需要进行某种校正(例如,Bonferroni 校正)。如果数据独立并且没有潜在的效应,即使存在 1/20 显著性的结果,我们也认为这是偶然发生的。

替代结局 (Surrogate outcomes)

不对患者及其照护者具有直接重要性的结局,但对以患者为中心的结局有预测性。

系统评价 (Systematic review)

一类评价,其使用特定及恰当的方法来确定、评价和总结解决特定问题的研究。它可以包括但不一定需要有 meta 分析)。

 

T

真阴性 (True negative)

没有目标疾病(依据金标准确定)的个体检验结果为阴性。

真阳性 (True positive)

患有目标疾病(依据金标准确定)的个体检验结果为阳性。

 

V

效度 (Validity)

研究的可靠性或严谨性。如果一项研究的设计和实施方案意味着结果无偏倚,并且能准确估算出正在评估的效应,那么这项研究具有内部效度。如果研究结果适用于常规临床实践中的患者,则该研究具有外部效度。

 

W

加权均数差 (weighted mean difference, WMD)

当结局是连续变量(例如症状评分或身高)而不是二分类变量(例如死亡或心肌梗死)时,使用的一种评估效应量的指标。将研究组间结局的均数差进行加权,以说明研究间不同的样本量和不同的精确度。WMD 是一个绝对值,因此采取原始结局指标的单位。