系统评价与 Meta-分析

系统评价(systematic review,SR)
针对某一具体医学及相关问题系统、全面地收集现有的(已发表或未发表的临床研究,采用临床流行病学严格评价文献的原则和方法,筛选出符合质量标准的文献,进行定性或定量合成(Meta-分析),得出科考德综合结论
  • 定性系统评价(qualitative systematic review)
  • 定量系统评价(quantitative systematic review):即包含 meta-分析过程
Meta-分析(meta-analysis)| 荟萃分析 | 汇总分析
一种统计分析方法,将多个独立的、可以合成的临床研究综合起来进行定量分析

系统评价

适用范围

  • 某种疗效的多个临床试验显示的疗效在程度和方向上不一致或冲突时;
  • 单个试验的样本量都偏小,不能显示统计学差异而不足以得出可靠的结论时;
  • 大规模的临床试验花费太大、消耗时间太长,不能开展时;
  • 当临床研究者计划新的临床试验时,首先通过系统评价有助于课题的选定
  • 需要进行亚组分析时。

进行系统评价的必要性

  1. 应对信息时代的挑战
  2. 及时转化和应用研究成果
  3. 提高统计效能

系统评价的流程

生产系统评价的基本过程一般分为 4 个阶段、9 个基本步骤。

系统评价流程

4 个阶段9 个步骤
确定系统评价题目1. 确定题目
指定系统评价方案2. 撰写系统评价研究方案和注册
完成系统评价全文3. 检索文献
4. 筛选文献
5. 评价文献质量
6. 提取数据
7. 分析和报告结果
8. 解释结果,撰写报告
更新系统评价9. 更新系统评价

确定题目选题

确定题目时应围绕研究问题明确 PICOS 要素。

系统评价的选题应遵循“三有一无”的原则:有意义;有争议;有研究;无重复

评价偏倚风险

研究质量评价应包括内部真实性外部真实性

内部真实性(internal validity)
单个研究结果接近真值的程度,即受各种偏倚因素的影响情况。
外部真实性(external validity)
指研究结果是否可用于研究对象以外的人群,即研究结果的实用价值与推广应用的情况,主要与研究对象的特征、研究措施的实施方法、结果的选择标准有关。

质量评价的作用:

  1. 作为纳入评价研究的选择标准(最低的质量要求)
  2. 讨论质量差异与研究结果异质性之间的相关性
  3. 在 meta-分析中根据质量高低决定赋予各个研究的权重
  4. 作为结果解释的参考,有助于决定结果推论的强度
  5. 为将来的研究提供建议

Cochrane 偏倚风险评估工具,包括 7 个方面:随机分配方法;分配方法隐藏;对研究对象、治疗方案实施者采用盲法;结果数据的完整性;选择性报告研究结果;其他偏倚来源

分析资料和报告结果

定性分析
定性分析(non-quantitative synthesis)
采用描述的方法,将每个临床研究的特征按研究对象、干预措施、研究结果、偏倚风险、设计方法等进行总结并列成表格形式,纵览所有研究间的差异,同时帮助制定定量合成计划及结果解释。
定性分析是定量分析前必不可少的步骤。
定量分析

定量分析包括同质性检验(或异质性检验)、meta-分析敏感性分析

异质性(heterogeneity)
定量系统评价(meta-分析)所使用的研究结果间存在的不可避免的差异。
  • 临床异质性(clinical heterogeneity):研究对象、干预措施、结果测量的差异
  • 方法学异质性(methodological heterogeneity):试验设计和质量的差异
  • 统计学异质性(statistical heterogeneity):干预措施的效应值的差异,是前两者共同作用的结果。

解释结果

  1. 总结和解释结果:结果的强度和方向(点估计值)和精确性(95%CI)
  2. 评价证据的总体质量GRADE 分级系统
  3. 证据的适用性:结果的应用价值
  4. 系统评价的局限性

结论

  1. 形成该结果对临床实践的指导意义
  2. 指导未来研究的依据和线索

系统评价的应用

  1. 临床医疗的应用
  2. 科研工作的需要
  3. 反映学科新动态
  4. 医学教育的需要
  5. 卫生决策的需要

Meta-分析

Meta-分析基本过程

数据提取(及汇总)、异质性检验模型选择(固定效应模型和随机效应模型)、合并效应量估计及假设检验

数据类型及效应量的表达

目前可用于 meta-分析的数据类型主要包括 5 类:二分类变量资料数值变量/连续性变量资料等级资料/有序多分类资料计数数据/密度资料生存资料(是否发生不良事件及发生时间)

效应量(effect size)
临床上有意义的值或该变量。

不同数据类型决定了效应量的表达:

  • 二分类变量资料:相对危险度(RR)、比值比(OR)、绝对危险度(AR)、NNT
  • 连续性变量资料、非罕发的(较大的)计数数据、较多分类的等级资料:均数差值(MD)、标准化均数差值(SMD)
  • 罕发的计数数据、较少分类的等级资料:转化为二分类变量资料
  • 类似发病密度的数据:risk ratio(RR)
  • 生存资料:风险比(hazard ratio,HR)

异质性检验

异质性检验方法主要有 Q 检验法(及 I2 指数)和图形目测法

一般 I2 < 50% 表明异质性在可接受的范围内,否则表明纳入研究的效应量存在较明显的异质性,I2 < 40% 表明异质性可忽略不计。

固定效应模型与随机效应模型的选择

  • 异质性检验无统计学意义(P > 0.10)且 I2 < 40%:选择固定效应模型
  • 异质性检验有统计学意义(P < 0.10)且 I2 > 50%:选择随机效应模型
  • 异质性明显(I2 > 75%):使用 meta-回归、亚组分析,探讨异质性来源
  • 异质性过于明显:放弃进行 meta-分析,仅作定性描述

合并效应量估计及其假设检验

常用的合并效应量的方法:

  • 固定效应模型
    1. M-H 法:可用于分类资料效应量的合并
    2. Peto 法(改良 M-H 法):以比数比为效应量的多个研究
    3. Inverse-variance 法:计量资料的均数差、分类资料的 OR、RR、RD 等效应量
  • 随机效应模型:一般用 D-L 法
森林图
森林图

森林图

By Thomas Lumley, User:HLHJ - Source code modified by User:HLHJ from the data and plotting scripts supplied with the GPL-2-licensed software package rmeta (part of the R statistical environment). See rmeta documentation., GPLv2, https://commons.wikimedia.org/w/index.php

  • 当效应量 OR、RR、RD、均数差、加权均数差的 95%CI 菱形/横线与森林图的无效线(横坐标为 1 或 0)相交时,可认为试验因素无效
  • 对于不利结局:当菱形/横线完全在无效线
    • 左侧,表明治疗组更有效
    • 右侧,表明对照组更有效
  • 对于有利结局则相反

发表性偏倚的识别与分析

发表性偏倚
有统计学意义的研究结果比无统计学意义的研究更容易投稿和被发表,由此产生的偏倚。

分析发表偏倚的方法有漏斗图法(最常用)、剪补法及公式法。

失安全数
使结论逆转所需新增的无统计学意义的研究数量。
失安全数越大,说明发表性偏倚的影响越小,meta-分析的结果越稳定。