静脉血栓栓塞症(venous thromboembolism,VTE)是指血液在静脉内不正常凝结所致血管完全或不完全阻塞,属静脉回流障碍性疾病,包括深静脉血栓(deep vein thrombosis,DVT)和肺血栓栓塞症(pulmonary thromboembolism,PTE),其发生率仅次于急性心肌梗死和脑卒中,半数以上VTE患者无明显体征,临床漏诊率极高,严重威胁患者生命健康,仅PTE的死亡率就高达17%[1]。2018年,国家卫生健康委员会正式启动肺栓塞和医院内VTE防治能力建设项目;2021年至今,提高“VTE规范预防率”被列为十项国家医疗质量安全改进目标之一[2]。研究表明,正确评估、早期预防可以降低患者血栓发生率和病死率[3],然而过度预防又会增加出血风险和经济负担。因此,使用恰当风险评估工具预测VTE至关重要。
目前国外针对VTE风险评估工具的研究较多,但工具间评价维度不尽相同,建立方法、证据来源不清晰,适用性和预测效能有待验证,因此迫切需要基于循证研究结果的临床指导意见。本研究旨在系统评价现有VTE风险评估工具的基本特征、评估维度及性能指标等,以期为构建我国理想的本土工具提供借鉴,为临床医护人员选择恰当工具评估VTE风险提供参考。
1 资料与方法
1.1 纳入与排除标准
1.1.1 研究类型
队列研究、病例-对照研究、横断面研究、实验性研究。
1.1.2 研究对象
年龄≥18岁的门诊、住院患者。
1.1.3 研究内容
VTE风险评估工具/模型的构建及验证。
1.1.4 排除标准
① 仅分析VTE风险因素,未构建评估工具/模型;② VTE复发风险评估工具;③ 无法获取全文的研究;④ 重复发表的研究;⑤ 非中、英文研究。
1.2 文献检索策略
计算机检索Embase、PubMed、CNKI、CBM、WanFang Data、VIP数据库,同步检索22个相关机构与学会网站,纳入VTE风险评估工具、标准或方法相关研究,检索时限均为建库至2022年12月31日。此外,追溯纳入研究的参考文献,以补充获取相关文献。检索采取主题词与自由词相结合的方式。英文检索词包括:venous thromboembolism、deep vein thrombosis、pulmonary embolism、risk assessment、risk evaluation、risk predicting等;中文检索词包括:静脉血栓、深静脉血栓、肺栓塞、肺血栓栓塞症、风险评估、预测模型等。22个相关机构及学会网站包括:① 中国、美国、英国、日本、加拿大等国家的15个卫生相关网站,包含中国国家卫生健康委、美国疾病控制与预防中心、英国卫生和社会福利部、日本厚生劳动省和加拿大卫生部等;② 7个学会网站:中华医学会、中国临床肿瘤学会、国际血栓与止血学会(International Society of Thrombosis and Hemostasis,ISTH)、欧洲心脏病学会(European Society of Cardiology,ESC)、美国胸科医师学会(American College of Chest Physicians,ACCP)、美国血液病学会(American Society of Hematology,ASH)、英国皇家妇产科医师学会(Royal College of Obstetricians and Gynaecologists,RCOG)。
1.3 文献筛选与资料提取
由2位研究者独立筛选文献、提取资料并交叉核对,如遇分歧通过讨论解决、必要时咨询第三方协助判断。文献筛选时首先阅读文题和摘要,在排除明显不相关的文献后,进一步阅读全文,以确定最终是否纳入。资料提取内容主要包括:① 基本特征:发布作者、年份、国家、研究设计类型、VTE的定义以及纳入和排除标准、数据来源、样本量、VTE风险因素或预测因子、适用疾病类型、适用人群等;② 工具评估维度;③ 工具形成方法、特异性、敏感性、是否风险分层、是否验证、结果呈现形式等。
1.4 统计分析
由于纳入研究的偏倚来源无法控制,异质性较大,本研究仅对结果定性分析,描述工具发布国家、机构、年份、适用疾病类型、适用人群、工具形成方法等基本特征;重点分析比较工具评估维度、工具性能、风险分层能力等关键要素。
2 结果
2.1 文献筛选流程及结果
初检出相关文献4 993篇,包括PubMed(n=1 303)、Embase(n=2 548)、VIP(n=277)、CBM(n=206)、WanFang Data(n=356)和CNKI(n=303),补充文献25篇。经逐层筛选后,最终纳入42个VTE风险评估工具[4-45]。
2.2 纳入工具的基本特征
美国发布的VTE风险评估工具最多,达17个,其次是中国、英国和意大利,均为4个。1996年,英格兰学者Autar等[4]研制了Autar DVT scale,为全球首个适用于评估骨科创伤患者VTE风险的评估工具。随着对VTE风险的广泛关注,风险评估工具发布数量逐年增加,仅2016—2019年就发布了15个。纳入VTE风险评估工具的基本特征见表1。
2.3 风险评估工具比较
2.3.1 工具评估维度
风险评估工具的评价维度涵盖:患者因素、疾病因素、治疗因素及实验室指标。① 患者因素评估条目主要包括:年龄、BMI、VTE既往史等;② 疾病因素包括肿瘤部位、肿瘤分期、创伤评分等;③ 治疗因素包括口服避孕药或激素治疗、手术时间、手术部位等;④ 实验室指标涵盖血红蛋白水平、血小板水平、白细胞计数等。其中,出现频次高的评估维度依次为VTE既往史(n=27)、年龄(n=23)、BMI(n=23)、肿瘤(n=20),分别占64.29%、54.76%、54.76%、47.62%。风险评估工具的评估维度比较详见表2。
2.3.2 工具预测因子及性能
① 33个工具进行了风险分层,并根据最终评分或风险预测因子数量区分高、中、低风险,以便对高危患者早识别、早干预。② 35个工具进行了方法学验证,其中19个进行了内部验证,且大多数内部验证采用将数据集分成工具构建、验证2个数据集或对建模数据集进行内部交叉验证的方法。③ 纳入工具的预测因子数量为2~44个,占比较高的是VTE既往史和年龄。④ 工具的最终呈现形式也不尽相同,其中30个工具以风险评分的方式呈现,6个工具结果呈现形式不明确。⑤ 对于工具性能的检验:大部分工具(n=16)均采用AUC值检验工具的区分度,AUC值>0.7提示预测性能较好;部分采用C统计量(n=9)和相关系数(n=4)进行检验。仅12个工具同时进行了特异性、敏感性、阴性预测值(negative predictive value,NPV)、阳性预测值(positive predictive value,PPV)和AUC或C-统计量分析。VTE风险评估工具的预测因子及性能比较见图1。
3 讨论
本研究纳入的风险评估工具偏倚风险:① 大部分工具均明确了研究对象的纳入与排除标准,以减少选择性偏倚,提高工具适用性,但部分工具(n=6)缺少内部或外部验证,导致偏倚风险增加;且建立工具的总样本量不足(Auter量表仅纳入30例患者)、未报告盲法、未恰当处理缺失数据、缺少性能评估、随访时间不足等也增加了偏倚风险。② 部分评估工具的方法学交代不清:未报告其建立的具体方法和细节,工具构建基于有限数据、专家意见或经验,主观性较强,导致偏倚风险较高。如Protecht score[14]仅参考Kucher模型[26],仅经验整合而成,文献也并未提及具体纳入与排除标准和患者基本特征。此外,研究设计和研究人群存在异质性,也会限制直接比较不同工具的可靠性和为实践推荐最佳工具的能力。③ 大多数工具构建采用Logistic回归模型,适应性较好,但整体偏倚风险高。
目前VTE风险评估工具几乎均由国外发布。工具之间因为研究者视角和指标不同,对同一疾病VTE风险评估结果不尽相同。例如同样用于多发性骨髓瘤的评估工具saved score[22]和IMPEDE VTE score[23],对同一预测因子—VTE既往史,前者赋予权重3分、后者为5分,联合使用地塞米松的剂量赋予权重评分也有所不同,导致评估结果有所差异,最终可能导致过度评分和人为将患者置于高风险类别。另外,目前国内评估工具基本从国外工具直接翻译或验证,受种族、危险因素、体征、生活习惯等差异的影响,其推广仍存在一定局限性。
此外,① 评估维度和证据来源不完全一致:几乎所有工具都是按照患者因素、疾病因素、治疗因素进行评价,但不同评估工具的具体项目并非完全一致,无法区分不同评价维度的导向性和重要性。再者预测因子过于简单或复杂,都会造成VTE风险评估偏倚。② 工具实施方法与结果呈现形式不同:部分工具未交代具体实施方法,透明度低,以定性描述为主,临床可操作性差。不同工具结果呈现形式也不同,不便解读与比较,大部分工具通过权重评分加和进行风险分层,少数工具仅按风险因素数量进行评估。③ 虽然部分工具在其原始研究中表现良好,但缺乏相关外部效度的验证研究,故其风险分层能力有待考究。
纳入的42个风险评估工具,仅9个进行了外部验证,包括TESS[6]、PABINGER[20]、IMPEDE[23]、Caprini[33]和Tic[42]等。然而,验证结果显示PABINGER[20]和IMPEDE[23]的C统计量均低于0.7,预测效果不尽如人意。另外部分工具还与已经进行的验证研究报道出现相互矛盾的情况[46]。当前临床常用VTE风险评估工具包括Caprini[33]、Khorana[12]以及Padua[27]等,不同指南针对不同病种有不同的工具推荐。每种工具都有其优缺点。Caprini和Khorana具有较高的敏感性,但在特异性方面有一定局限性;且研究表明Khorana对胰腺癌患者无法区分VTE中高风险[47],该工具在国内还需要大样本研究以验证其有效性。Caprini于1991年研发,目前更新至2013版,涵盖40余项风险预测因子,繁多的预测因子导致其临床可操作性差,也有研究显示其可能低估髋关节置换术患者VTE风险[48]。另外《医院内静脉血栓栓塞症防治质量评价与管理指南(2022版)》[49]推荐非手术患者采用Padua评分量表,此量表是以西方患者临床特征为基础构建,目前国内研究较少、验证不充分。因此,建议通过更多大样本、前瞻性的临床研究,进一步细化患者VTE风险评估,为临床实践提供更加精准的指导建议。
目前基于中国人群建立的VTE风险评估工具仅有李玉萍等发布的a nomogram model[24](用于肺癌)、朱晓光模型[11](用于ICU多发伤患者)、陈颖模型[45](用于ICU危重症患者)和G-Caprini[35](用于妇科手术患者),与国外基于大量临床资料及充分文献回顾构建的评估工具相比,前者还需更多前瞻性研究来验证其有效性。因此本研究建议:① 直接翻译使用国外工具难以满足我国国情需要,可以充分借鉴与参考国外工具形成方法和实践经验,兼顾我国人群特点探索研发具有我国知识产权、可操作性强的评估工具。② VTE风险高低并非一成不变,受疾病进展、患者基本特征等风险因素的改变而动态变化,应赋于风险评估工具更新功能与机制,需在入院前、出院后、随访过程中动态评估风险级别。③ 克服现有工具开发主要基于回顾性研究和Logistic回归模型的局限性,补充高质量的长期观察性研究作为重要证据来源,拓宽适用性。并充分按照循证医学方法学及学科决策理念制定评估工具,突显证据对结果的重要性,提高工具的可信度[50]。④ 基于科学研究构建全方位、多层次的风险评估维度、确定各个维度及指标的重要性、赋予权重评分,以增加适用性、可行性,最终构建契合我国实际需求的全面、重点明确、可操作性强并可持续更新与改进的VTE风险评估工具。⑤ 加强电子病历警报系统的开发和优化,同时控制警报疲劳,提高临床可及性。总之,理想的评估工具应当覆盖患者、疾病、治疗、实验室指标等全方位、多层次的评估维度,赋予医务人员和目标使用人群多维度评估能力,且结果简单清晰,方便区分高、中、低风险,辅助临床决策,以降低VTE发生率和死亡率,提升医疗质量。
综上所述,尽管现有VTE风险评估工具较多,但由于构建方法单一、适应性的局限以及缺乏外部效度验证等问题,这些工具在我国临床推广仍存在一定局限性。因此,未来建议工具不仅仅停留在构建研发阶段,还需注重开展多中心大样本试验来进行工具的临床验证。
静脉血栓栓塞症(venous thromboembolism,VTE)是指血液在静脉内不正常凝结所致血管完全或不完全阻塞,属静脉回流障碍性疾病,包括深静脉血栓(deep vein thrombosis,DVT)和肺血栓栓塞症(pulmonary thromboembolism,PTE),其发生率仅次于急性心肌梗死和脑卒中,半数以上VTE患者无明显体征,临床漏诊率极高,严重威胁患者生命健康,仅PTE的死亡率就高达17%[1]。2018年,国家卫生健康委员会正式启动肺栓塞和医院内VTE防治能力建设项目;2021年至今,提高“VTE规范预防率”被列为十项国家医疗质量安全改进目标之一[2]。研究表明,正确评估、早期预防可以降低患者血栓发生率和病死率[3],然而过度预防又会增加出血风险和经济负担。因此,使用恰当风险评估工具预测VTE至关重要。
目前国外针对VTE风险评估工具的研究较多,但工具间评价维度不尽相同,建立方法、证据来源不清晰,适用性和预测效能有待验证,因此迫切需要基于循证研究结果的临床指导意见。本研究旨在系统评价现有VTE风险评估工具的基本特征、评估维度及性能指标等,以期为构建我国理想的本土工具提供借鉴,为临床医护人员选择恰当工具评估VTE风险提供参考。
1 资料与方法
1.1 纳入与排除标准
1.1.1 研究类型
队列研究、病例-对照研究、横断面研究、实验性研究。
1.1.2 研究对象
年龄≥18岁的门诊、住院患者。
1.1.3 研究内容
VTE风险评估工具/模型的构建及验证。
1.1.4 排除标准
① 仅分析VTE风险因素,未构建评估工具/模型;② VTE复发风险评估工具;③ 无法获取全文的研究;④ 重复发表的研究;⑤ 非中、英文研究。
1.2 文献检索策略
计算机检索Embase、PubMed、CNKI、CBM、WanFang Data、VIP数据库,同步检索22个相关机构与学会网站,纳入VTE风险评估工具、标准或方法相关研究,检索时限均为建库至2022年12月31日。此外,追溯纳入研究的参考文献,以补充获取相关文献。检索采取主题词与自由词相结合的方式。英文检索词包括:venous thromboembolism、deep vein thrombosis、pulmonary embolism、risk assessment、risk evaluation、risk predicting等;中文检索词包括:静脉血栓、深静脉血栓、肺栓塞、肺血栓栓塞症、风险评估、预测模型等。22个相关机构及学会网站包括:① 中国、美国、英国、日本、加拿大等国家的15个卫生相关网站,包含中国国家卫生健康委、美国疾病控制与预防中心、英国卫生和社会福利部、日本厚生劳动省和加拿大卫生部等;② 7个学会网站:中华医学会、中国临床肿瘤学会、国际血栓与止血学会(International Society of Thrombosis and Hemostasis,ISTH)、欧洲心脏病学会(European Society of Cardiology,ESC)、美国胸科医师学会(American College of Chest Physicians,ACCP)、美国血液病学会(American Society of Hematology,ASH)、英国皇家妇产科医师学会(Royal College of Obstetricians and Gynaecologists,RCOG)。
1.3 文献筛选与资料提取
由2位研究者独立筛选文献、提取资料并交叉核对,如遇分歧通过讨论解决、必要时咨询第三方协助判断。文献筛选时首先阅读文题和摘要,在排除明显不相关的文献后,进一步阅读全文,以确定最终是否纳入。资料提取内容主要包括:① 基本特征:发布作者、年份、国家、研究设计类型、VTE的定义以及纳入和排除标准、数据来源、样本量、VTE风险因素或预测因子、适用疾病类型、适用人群等;② 工具评估维度;③ 工具形成方法、特异性、敏感性、是否风险分层、是否验证、结果呈现形式等。
1.4 统计分析
由于纳入研究的偏倚来源无法控制,异质性较大,本研究仅对结果定性分析,描述工具发布国家、机构、年份、适用疾病类型、适用人群、工具形成方法等基本特征;重点分析比较工具评估维度、工具性能、风险分层能力等关键要素。
2 结果
2.1 文献筛选流程及结果
初检出相关文献4 993篇,包括PubMed(n=1 303)、Embase(n=2 548)、VIP(n=277)、CBM(n=206)、WanFang Data(n=356)和CNKI(n=303),补充文献25篇。经逐层筛选后,最终纳入42个VTE风险评估工具[4-45]。
2.2 纳入工具的基本特征
美国发布的VTE风险评估工具最多,达17个,其次是中国、英国和意大利,均为4个。1996年,英格兰学者Autar等[4]研制了Autar DVT scale,为全球首个适用于评估骨科创伤患者VTE风险的评估工具。随着对VTE风险的广泛关注,风险评估工具发布数量逐年增加,仅2016—2019年就发布了15个。纳入VTE风险评估工具的基本特征见表1。
2.3 风险评估工具比较
2.3.1 工具评估维度
风险评估工具的评价维度涵盖:患者因素、疾病因素、治疗因素及实验室指标。① 患者因素评估条目主要包括:年龄、BMI、VTE既往史等;② 疾病因素包括肿瘤部位、肿瘤分期、创伤评分等;③ 治疗因素包括口服避孕药或激素治疗、手术时间、手术部位等;④ 实验室指标涵盖血红蛋白水平、血小板水平、白细胞计数等。其中,出现频次高的评估维度依次为VTE既往史(n=27)、年龄(n=23)、BMI(n=23)、肿瘤(n=20),分别占64.29%、54.76%、54.76%、47.62%。风险评估工具的评估维度比较详见表2。
2.3.2 工具预测因子及性能
① 33个工具进行了风险分层,并根据最终评分或风险预测因子数量区分高、中、低风险,以便对高危患者早识别、早干预。② 35个工具进行了方法学验证,其中19个进行了内部验证,且大多数内部验证采用将数据集分成工具构建、验证2个数据集或对建模数据集进行内部交叉验证的方法。③ 纳入工具的预测因子数量为2~44个,占比较高的是VTE既往史和年龄。④ 工具的最终呈现形式也不尽相同,其中30个工具以风险评分的方式呈现,6个工具结果呈现形式不明确。⑤ 对于工具性能的检验:大部分工具(n=16)均采用AUC值检验工具的区分度,AUC值>0.7提示预测性能较好;部分采用C统计量(n=9)和相关系数(n=4)进行检验。仅12个工具同时进行了特异性、敏感性、阴性预测值(negative predictive value,NPV)、阳性预测值(positive predictive value,PPV)和AUC或C-统计量分析。VTE风险评估工具的预测因子及性能比较见图1。
3 讨论
本研究纳入的风险评估工具偏倚风险:① 大部分工具均明确了研究对象的纳入与排除标准,以减少选择性偏倚,提高工具适用性,但部分工具(n=6)缺少内部或外部验证,导致偏倚风险增加;且建立工具的总样本量不足(Auter量表仅纳入30例患者)、未报告盲法、未恰当处理缺失数据、缺少性能评估、随访时间不足等也增加了偏倚风险。② 部分评估工具的方法学交代不清:未报告其建立的具体方法和细节,工具构建基于有限数据、专家意见或经验,主观性较强,导致偏倚风险较高。如Protecht score[14]仅参考Kucher模型[26],仅经验整合而成,文献也并未提及具体纳入与排除标准和患者基本特征。此外,研究设计和研究人群存在异质性,也会限制直接比较不同工具的可靠性和为实践推荐最佳工具的能力。③ 大多数工具构建采用Logistic回归模型,适应性较好,但整体偏倚风险高。
目前VTE风险评估工具几乎均由国外发布。工具之间因为研究者视角和指标不同,对同一疾病VTE风险评估结果不尽相同。例如同样用于多发性骨髓瘤的评估工具saved score[22]和IMPEDE VTE score[23],对同一预测因子—VTE既往史,前者赋予权重3分、后者为5分,联合使用地塞米松的剂量赋予权重评分也有所不同,导致评估结果有所差异,最终可能导致过度评分和人为将患者置于高风险类别。另外,目前国内评估工具基本从国外工具直接翻译或验证,受种族、危险因素、体征、生活习惯等差异的影响,其推广仍存在一定局限性。
此外,① 评估维度和证据来源不完全一致:几乎所有工具都是按照患者因素、疾病因素、治疗因素进行评价,但不同评估工具的具体项目并非完全一致,无法区分不同评价维度的导向性和重要性。再者预测因子过于简单或复杂,都会造成VTE风险评估偏倚。② 工具实施方法与结果呈现形式不同:部分工具未交代具体实施方法,透明度低,以定性描述为主,临床可操作性差。不同工具结果呈现形式也不同,不便解读与比较,大部分工具通过权重评分加和进行风险分层,少数工具仅按风险因素数量进行评估。③ 虽然部分工具在其原始研究中表现良好,但缺乏相关外部效度的验证研究,故其风险分层能力有待考究。
纳入的42个风险评估工具,仅9个进行了外部验证,包括TESS[6]、PABINGER[20]、IMPEDE[23]、Caprini[33]和Tic[42]等。然而,验证结果显示PABINGER[20]和IMPEDE[23]的C统计量均低于0.7,预测效果不尽如人意。另外部分工具还与已经进行的验证研究报道出现相互矛盾的情况[46]。当前临床常用VTE风险评估工具包括Caprini[33]、Khorana[12]以及Padua[27]等,不同指南针对不同病种有不同的工具推荐。每种工具都有其优缺点。Caprini和Khorana具有较高的敏感性,但在特异性方面有一定局限性;且研究表明Khorana对胰腺癌患者无法区分VTE中高风险[47],该工具在国内还需要大样本研究以验证其有效性。Caprini于1991年研发,目前更新至2013版,涵盖40余项风险预测因子,繁多的预测因子导致其临床可操作性差,也有研究显示其可能低估髋关节置换术患者VTE风险[48]。另外《医院内静脉血栓栓塞症防治质量评价与管理指南(2022版)》[49]推荐非手术患者采用Padua评分量表,此量表是以西方患者临床特征为基础构建,目前国内研究较少、验证不充分。因此,建议通过更多大样本、前瞻性的临床研究,进一步细化患者VTE风险评估,为临床实践提供更加精准的指导建议。
目前基于中国人群建立的VTE风险评估工具仅有李玉萍等发布的a nomogram model[24](用于肺癌)、朱晓光模型[11](用于ICU多发伤患者)、陈颖模型[45](用于ICU危重症患者)和G-Caprini[35](用于妇科手术患者),与国外基于大量临床资料及充分文献回顾构建的评估工具相比,前者还需更多前瞻性研究来验证其有效性。因此本研究建议:① 直接翻译使用国外工具难以满足我国国情需要,可以充分借鉴与参考国外工具形成方法和实践经验,兼顾我国人群特点探索研发具有我国知识产权、可操作性强的评估工具。② VTE风险高低并非一成不变,受疾病进展、患者基本特征等风险因素的改变而动态变化,应赋于风险评估工具更新功能与机制,需在入院前、出院后、随访过程中动态评估风险级别。③ 克服现有工具开发主要基于回顾性研究和Logistic回归模型的局限性,补充高质量的长期观察性研究作为重要证据来源,拓宽适用性。并充分按照循证医学方法学及学科决策理念制定评估工具,突显证据对结果的重要性,提高工具的可信度[50]。④ 基于科学研究构建全方位、多层次的风险评估维度、确定各个维度及指标的重要性、赋予权重评分,以增加适用性、可行性,最终构建契合我国实际需求的全面、重点明确、可操作性强并可持续更新与改进的VTE风险评估工具。⑤ 加强电子病历警报系统的开发和优化,同时控制警报疲劳,提高临床可及性。总之,理想的评估工具应当覆盖患者、疾病、治疗、实验室指标等全方位、多层次的评估维度,赋予医务人员和目标使用人群多维度评估能力,且结果简单清晰,方便区分高、中、低风险,辅助临床决策,以降低VTE发生率和死亡率,提升医疗质量。
综上所述,尽管现有VTE风险评估工具较多,但由于构建方法单一、适应性的局限以及缺乏外部效度验证等问题,这些工具在我国临床推广仍存在一定局限性。因此,未来建议工具不仅仅停留在构建研发阶段,还需注重开展多中心大样本试验来进行工具的临床验证。