引用本文: 田楚伟, 陈翔溆, 朱桓毅, 秦晟博, 石柳, 芮云峰. 机器学习在创伤骨科中的应用与展望. 中国修复重建外科杂志, 2023, 37(12): 1562-1568. doi: 10.7507/1002-1892.202308064 复制
人工智能是一门新的技术科学,包括研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统[1]。近年来,随着数据处理能力飞速发展、医工交叉逐步深入,人工智能在医学领域得到了广泛应用[2],在各种任务中的表现与人类相当或者更好,尤其是图像识别以及数据分析领域[3]。作为人工智能的一个分支,机器学习是一门通过编程让计算机从数据中进行学习的科学[4],包含了深度学习和人工神经网络等分支,在图像处理、语言识别等领域具有广阔应用前景[5-6]。
由于经济飞速发展和工业化程度提高,交通事故和工程意外等创伤事件已成为危害人类健康的重要因素,美国2016年死亡原因调查报告显示创伤是导致45岁以下人群死亡的主要原因[7]。由于创伤骨科患者的复杂性,诊疗过程中往往需要多学科协作,预后受到医疗资源分配的重要影响。目前,科技发展已经步入大数据时代,临床医学和工程科学的交叉合作日渐紧密,如何结合工程科学进一步优化创伤骨科的诊疗流程和医疗资源配置,成为未来研究的重中之重。现回顾机器学习概念,综述其在创伤骨科影像识别、临床决策及评估、围术期与预后风险预测及数据处理中的应用进展,展望机器学习在创伤骨科的应用前景。
1 机器学习概念
机器学习作为人工智能的一个分支,旨在探讨数据分析与计算机算法的交集[8]。1959年,人工智能先驱Arthur Samuel定义机器学习是一个研究领域,让计算机无需进行明确编程就具备学习能力。该定义指出了机器学习的3个阶段,即数据预处理、模型训练和评估[9]。数据预处理阶段包括研究问题的确立、数据集建立以及训练集和测试集的划分。模型训练阶段包括监督学习、无监督学习以及强化学习3种学习方式,其中监督学习所需要的数据量与学习时间最少[10-11]。评估阶段是通过测试集验证生成的模型来确定模型性能优劣。
近年来,许多机器学习模型在医学数据处理、辅助诊断以及预后预测方面得到了广泛应用。目前常见的机器学习算法包括朴素贝叶斯、决策树、支持向量机、人工神经网络等(图1)。其中,决策树能够从一系列有特征和标签的数据中总结出决策规则,并以树状图结构呈现,可以解决分类和回归问题[12]。随机森林以及梯度提升器(eXtreme Gradient Boosting,XGBoot)是基于决策树模型的两种集成算法,通过对树的堆叠可以大幅提升模型应用性能[13]。支持向量机是近年来最受关注的机器学习算法之一,最接近深度学习,已被广泛应用于图像分类以及数据识别分类[14]。此外,传统统计学方法,例如逻辑回归和朴素贝叶斯,在机器学习模型相关研究中也有着广泛应用。人工神经网络是一种模拟人类神经元处理方式的机器学习算法,这一构想由McCulloch于20世纪40年代提出[15]。2006年, Hinton等[16]在其论文中展示了以最先进的精度识别手写数字的深度神经网络算法,并将这种技术称为“深度学习”。与简单的一层或两层神经网络相比,深度学习复杂的网络层次可以让算法学习更复杂的数据模式[17-18]。卷积神经网络是最常见的深度学习模型,其通过在图像中搜索简单特征并汇总,以得到更复杂的特征[19]。对于分类特征,卷积神经网络会为图像作出分类决策,并和已知的图像分类进行比较来得到误差[20]。通过这一训练过程,卷积神经网络可以更新其学习参数,并对新的图像作出分类决策[20-21]。
如今,随着深度学习的飞速发展,这项技术已经深入人们的生活,从网络浏览的智能推荐到语音识别、无人驾驶技术。近年来,其在医疗领域的应用也逐渐深入,尤其是在影像识别领域,有着广袤的应用前景。
2 机器学习在创伤骨科影像识别与诊断中的应用
骨科疾病的诊断极其依赖影像学证据,主要包括X线片、CT以及MRI。随着近年来深度学习算法的飞速发展,机器学习在影像识别领域展现出了广阔应用前景[20],尤其在创伤骨科,机器学习及其衍生成像技术在协助骨折诊断方面有着极高准确率[22]。在深度学习诞生之初,Brett等[23]便探讨了通过计算机影像识别技术标记椎体,并构建了识别非侧凸患者T4~L4椎体骨折模型。在卷积神经网络将ImageNet数据集120万张高分辨率图像准确分类之后,这一领域取得重大突破,深度学习逐渐成为最流行的机器学习技术[24]。
上肢骨折方面,Kim等[25]通过深度学习算法模型训练了11 112张桡骨远端骨折与正常的腕关节X线片,并进行了外部验证,其模型诊断特异度、灵敏度以及受试者工作特征曲线下面积(area under curve,AUC)分别为0.88、0.90、0.954,这一研究展示了卷积神经网络在识别桡骨远端骨折方面的应用前景。对于难以诊断的隐匿性骨折,临床医师往往会选择CT检查来进行排除,而深度学习算法可以有效发现隐匿性骨折,减少漏诊和过度检查。此外,Chung等[26]开发了一个基于卷积神经网络诊断肱骨近端骨折并识别其Neer分型的模型,结果显示该模型检测肱骨近端骨折准确性高,分型准确性达0.65~0.85;对于复杂的3~4部分肱骨近端骨折,其基于X线片诊断的准确性明显优于骨科及放射科医师。
下肢较上肢更容易发生隐匿性骨折,因此深度学习算法作为辅助诊断方式有着更大的潜在应用价值[27]。Urakawa等[28]的研究显示隐匿性髋部骨折发生率为4%~9%,为此他们设计了一个基于卷积神经网络诊断股骨转子间骨折的模型,使用了1 773张骨折影像以及1 573张非骨折影像,结果显示与矫形外科医师相比,深度学习模型有着更准确的判别。此外,Mutasa等[3]使用深度学习算法对127张GardenⅠ、Ⅱ型,610张Garden Ⅲ、Ⅳ型股骨颈骨折以及326张正常髋关节X线片进行建模,以期识别股骨颈骨折并进行Garden分型。结果显示,该模型识别骨折准确性为0.92、AUC为 0.92,骨折分型准确性为0.86、AUC为0.96。对于漏诊率较高的胫腓骨下段骨折以及足部骨折,Kitamura等[29]通过迭代298张骨折影像和298张正常影像,采用深度学习算法检测这些部位的隐匿性骨折,准确性达0.76~0.81。在CT识别及三维建模方面,汤小勇等[30]的研究显示在Mimics软件中通过人工智能辅助分割图像,可以大幅缩短膝关节三维模型建立时间,有助于提高放射科医师及骨科医师的诊断效率,并且这一系统在膝关节手术术前规划中也有着广阔应用前景。另外,有学者通过深度学习模型辅助CT断层影像进行跟骨骨折分型研究,同样有着很高的准确性[31]。
此外,在椎体骨折领域,临床医师通过影像学资料诊断椎体压缩性骨折的假阴性率为29.5%~46.5%[32]。Tomita等[33]使用卷积神经网络算法来识别和定位椎体骨折情况,研究共纳入1 432张CT影像进行训练,准确性为0.89。另外,Muehlematter等[34]基于58例脊椎不全骨折患者的CT资料开发了一个骨质分析结合机器学习的诊断模型,虽然该模型可以高精度识别不全椎体骨折,但是在分析单个椎体骨折发生风险时准确性较低。未来随着不同人群的CT影像样本增加,以及影像资料提取精确度提升,模型预测准确性有望进一步提高。见表1。
上述研究结果显示深度学习的影像识别性能与骨科及放射科医师相似,但在运算效率以及识别隐匿性骨折方面效能更佳。此外,骨折分型对治疗方案有着指导意义,随着算法效率以及影像资料数据量的提升,深度学习对骨折诊断和分型的精度也将逐渐提高。人工智能辅助诊断有利于临床医师快速确定诊疗方案、进一步优化医疗资源分配,带来巨大的社会和经济效益。
3 机器学习在创伤骨科临床决策及评估中的应用
与传统逻辑回归以及线性回归方法相比,许多机器学习算法可以识别非线性模型,从而提高预测结果准确性[35-36]。创伤骨科的复杂性决定了其临床治疗决策存在着较大可变性,近年来越来越多学者将机器学习算法应用到临床决策中[37-38]。机器学习算法建模以及临床转化流程见图2。
长期以来,创伤事件被认为是不可预测的。随着人工智能的飞速发展,一些模型被证明可以预测创伤事件发生概率。Dennis等[39]采用人工神经网络成功预测了多个创伤中心的患者容量和创伤事件发生高峰期,为创伤调度系统分配医疗资源提供了数据支持。此外,Stonko等[40]纳入了时间和天气因素来构建预测创伤事件数量、创伤严重程度以及急诊手术病例数的机器学习模型,该模型准确性高,有助于创伤管理关口前移并进一步合理分配医疗资源。
在跌倒及骨折风险评估方面,Kong等[41]比较了梯度提升算法CatBoost、支持向量机、逻辑回归以及骨折风险评估工具(WHO Fracture Risk Assessment Tool,FRAX)在预测骨质疏松症患者骨折风险方面的效果,结果显示CatBoost算法在预测脆性骨折方面显著优于FRAX(AUC 0.688 vs. 0.663,P<0.01)。此外,Forth等[42]通过机器学习算法分析了测力板所收集的老年人站立受力,通过建模得出姿势稳定性评分(postural stability,PS)(1~10),PS分数越高,稳定性越高,跌倒风险越低,通过算法分析得出的PS分数准确性为0.78。而作者的随访资料表明跌倒高风险人群(PS 1~3分)在1年内跌倒的可能性是低风险人群(PS 7~10分)的3倍。通过对老年人群跌倒风险的评估,可以快速识别跌倒高危人群及危险因素,从而达到“上医治未病”的预防效果。
创伤骨科患者治疗具有紧急和复杂性的特点,往往需要医师在急诊时对患者进行预处理,而机器学习算法作为辅助手段可以提高医师处理效率[43]。目前,这一领域的研究主要聚焦在对创伤患者病情及预后的评估。Liu等[44]开发了一种基于多参数机器学习算法和系统的模型,预测创伤患者对救生干预的需求,准确性达89.8%,为机器学习算法辅助急诊评估并干预创伤患者探索了应用可能。风险评估及预后预测方面,Cardosi等[45]通过回顾美国国家创伤数据库 2 007 485例创伤患者的临床数据,采用机器学习算法构建了创伤预测模型,分析不同患者的并发症风险和预后情况,模型AUC在0.85~0.87范围。接着,作者探索了这一创伤预测模型推广应用的可行性,认为该模型可以为医疗决策者提供决策支持。此外,Lee等[46]通过对创伤患者年龄组分类、严重程度选择和创伤相关变量的评分校准,提高了XGBoost算法预测创伤患者短期及长期预后的性能,并给出了影响患者预后的高危特征。
由于创伤的复杂性,如何获得标准化临床数据是机器学习在创伤骨科领域临床转化的关键。面对复杂多元的临床数据,我们可以通过机器学习算法进行数据清洗及归一化处理,以获得同质性数据用以建模。此外,积累大规模的临床数据将有助于进一步发掘和总结创伤骨科的临床规律,加速创伤骨科领域研究的进展。
4 机器学习在创伤骨科围术期与预后风险预测中的应用
近年来,许多研究聚焦了机器学习在创伤骨科患者围术期及术后长期并发症风险预测中的应用。Zhao等[47]比较了机器学习算法和逻辑回归等传统统计学方法在预测髋部骨折患者术后谵妄发生率及其危险因素的效果,结果显示XGBoost、支持向量机以及随机森林算法预测准确性在0.83~0.87之间,均高于逻辑回归。接着,作者综合了各个模型的特征重要性,确立了术前等待时间、血管加压药物的使用、虚弱指数、痴呆/卒中史、手术持续时间以及麻醉方式是导致髋部骨折患者术后谵妄最主要的6个危险因素。Li等[48]开发了一种基于机器学习的预测模型,以评估髋部骨折患者术后转入ICU、并发症发生以及延迟出院的风险,结果显示机器学习模型在预测术后ICU转科(0.835 vs. 0.692,P<0.01)、并发症发生(0.810 vs. 0.629,P<0.01)以及延迟出院(0.832 vs. 0.618,P<0.01)的准确性方面均优于美国麻醉医师协会全身状态分级系统(ASA-PS)。对于术后长期并发症,Klemt等[49]采用机器学习算法评估了人工全髋关节置换患者术后二次翻修的危险因素,判别、校准及决策曲线分析显示人工神经网络、随机梯度提升、随机森林和弹性惩罚逻辑回归 4种机器学习模型均取得了优异表现。通过机器学习方法对围术期并发症及其危险因素的识别,临床医师可以快速识别高危患者并及时处理,为优化围术期诊疗流程、降低并发症发生率提供了新的研究方向。
此外,在预测患者短期和长期预后方面,机器学习算法也有着很高的准确性。DeBaun等[50]比较了不同算法预测患者髋部骨折后30 d死亡率的性能,结果显示人工神经网络的AUC(0.92)最高,其次是逻辑回归(AUC 0.87)和朴素贝叶斯(AUC 0.83)。Forssten等[51]比较了支持向量机、朴素贝叶斯、随机森林以及逻辑回归算法预测髋部骨折患者术后1年死亡率的性能,结果显示前3种算法存在高估患者死亡率的可能,而逻辑回归在预测长期预后方面性能最优,这一研究肯定了传统统计学方法在预测预后方面的应用优势。
5 机器学习在创伤骨科临床应用中的挑战
随着科学技术的发展以及算法效率的提升,机器学习在医疗领域的应用逐渐深入[52]。在创伤骨科领域,机器学习算法作为一种辅助手段,在骨折诊断与分型、患者围术期护理及预后分析方面都有着广阔应用前景[53-54]。然而,在机器学习算法应用过程中仍存在一些挑战[4]。
第一,机器学习研究及应用的伦理原则。在机器学习研究及应用过程中,如何确保数据的准确性和隐私保护是值得关注的问题[55]。现阶段机器学习领域缺乏一个公认的伦理实践指导规范,但在研究过程中仍应确保科学性服从伦理性的原则。
第二,临床数据库中数据的质量和数量。训练的机器学习模型需要大量高质量数据,而创伤骨科患者的复杂性决定了收集的数据难以同时满足同质性和多样化两个需求,这就需要进一步扩大临床数据的样本量及样本特征数量,为模型拟合提供充足和多元的样本支持。
第三,机器学习模型的可解释性。机器学习模型对数据的拟合能力强于传统统计学方法,然而其带来的模型过拟合是一个绕不开的话题。强机器学习模型如深度神经网络等被视为“黑盒”,往往难以解释其结果及推理过程[56]。因此,如何评估机器学习模型的可解释性并构建解释性强的应用模型成为了一个亟待解决的问题。
第四,通用模型无法满足个性化诊疗需求。创伤骨科领域的临床实践需要高度个性化的治疗方案。由于临床医学并不是一门程序化科学,在创伤骨科领域,临床医师的主观能动性以及针对性治疗决策至关重要。每例患者的创伤类型、严重程度和生理状况各异,通用的机器学习模型可能无法完全满足个体化需求,开发针对个体患者的定制化算法和治疗计划将成为未来发展方向之一。
6 机器学习在创伤骨科临床应用的展望
尽管面临挑战,机器学习算法在创伤骨科临床应用中也呈现出巨大应用前景。创伤骨科的临床应用中,创伤类型的准确分类对于制定合理的治疗方案至关重要。通过对大量临床数据和影像数据的分析,机器学习模型能够识别和分类不同类型创伤骨折,从而帮助医生更准确地做出诊断和治疗决策,有助于缩短诊断时间,降低误诊率,提高患者的治疗效果。此外,通过分析患者的临床数据、生理指标以及影像数据,机器学习模型可以预测患者发生创伤的风险。基于这些预测结果,医生可以采取相应干预措施,减少患者发生创伤可能性。这对于高风险患者的管理和监控具有重要意义,从而达到“治未病”的目的。
院前,通过开发区域创伤系统,根据患者分布的地理位置空间来确定创伤中心的最佳位置以及高峰期创伤急诊的患者负荷,以期进一步合理配置创伤资源、降低单个创伤中心的负担[57]。Dooley等[58]介绍了基于需求的创伤系统评估工具,这一系统采用了地理空间建模,为地方创伤中心规划提供了证据支持,有助于评估区域内人口的创伤发生率、创伤中心覆盖率以及潜在的经济影响。
术前,临床医师可以通过机器学习模型分析患者影像数据,制定最佳手术计划。米尔阿地力·麦麦提依明等[59]采用人工智能术前规划系统在人工全髋关节置换术前进行假体型号预测,获得了较高的准确性和可重复性。此外,对于发生骶骨脆性骨折的老年患者,Kamer等[60]通过基于CT的人工智能三维建模来评估骶髂关节骨性通道,并在术前用以规划植入物位置。随着技术的进步,通过人工智能进行术前规划的精度也将逐渐提高,这有助于缩短手术医师学习曲线,使手术过程更加精确和安全,从而提高手术成功率,降低手术风险。
术中,通过机器学习算法进行精确定位以及人工智能增强现实技术可以辅助手术医师操作,降低手术难度。殷耀斌等[61]报道了1例机器人辅助四角融合经皮螺钉内固定病例,通过人工智能辅助定位实现了微创而精准的经皮四角融合,从而减少了透视次数及放射性暴露。另外,贾鹏等[62]报道了国产通用型骨科手术机器人天玑(TiRobot)在创伤骨科领域的应用,为骨盆髋臼骨折、髋部骨折、手足骨折等固定提供了微创化、智能化、精准化的解决方案。随着增强现实技术及人工智能的飞速发展,将进一步推动手术机器人的临床转化。
此外,术后康复作为创伤骨科不可或缺的一环,机器学习算法可以根据患者的临床数据和康复进展,为患者制定个性化康复方案。Santilli等[63]构建了4个基于决策树的集成模型,用于评估骨科及神经科患者出院后的康复计划改善患者功能的潜力。通过分析及检测患者的康复数据,模型可以预测康复进展,帮助医师做出及时调整,以最大程度提升康复效果。
综上述,随着近年来技术进步及算法效率的提升,机器学习在创伤骨科领域的应用渐广。机器学习算法在影像资料建模(即骨折识别)、诊断与分层,以及临床决策(包括跌倒与骨折预防、急诊处理、围术期与预后风险预测)等方面,均有着良好准确性。当前,机器学习在创伤骨科中的应用还处于研究与探索阶段,随着科技进步和数据量增长,机器学习模型的精度和应用价值将会大幅提升,在辅助诊断、指导决策、制定个性化医疗方案以及合理配置临床资源等领域有着广阔的应用前景。
利益冲突 在课题研究和文章撰写过程中不存在利益冲突;经费支持没有影响文章观点及其报道
作者贡献声明 田楚伟:文章撰写及修改;陈翔溆、朱桓毅:观点形成与综述构思;朱桓毅、秦晟博:文献检索;田楚伟、陈翔溆、石柳:文献筛选;芮云峰:选题指导与综述构思
人工智能是一门新的技术科学,包括研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统[1]。近年来,随着数据处理能力飞速发展、医工交叉逐步深入,人工智能在医学领域得到了广泛应用[2],在各种任务中的表现与人类相当或者更好,尤其是图像识别以及数据分析领域[3]。作为人工智能的一个分支,机器学习是一门通过编程让计算机从数据中进行学习的科学[4],包含了深度学习和人工神经网络等分支,在图像处理、语言识别等领域具有广阔应用前景[5-6]。
由于经济飞速发展和工业化程度提高,交通事故和工程意外等创伤事件已成为危害人类健康的重要因素,美国2016年死亡原因调查报告显示创伤是导致45岁以下人群死亡的主要原因[7]。由于创伤骨科患者的复杂性,诊疗过程中往往需要多学科协作,预后受到医疗资源分配的重要影响。目前,科技发展已经步入大数据时代,临床医学和工程科学的交叉合作日渐紧密,如何结合工程科学进一步优化创伤骨科的诊疗流程和医疗资源配置,成为未来研究的重中之重。现回顾机器学习概念,综述其在创伤骨科影像识别、临床决策及评估、围术期与预后风险预测及数据处理中的应用进展,展望机器学习在创伤骨科的应用前景。
1 机器学习概念
机器学习作为人工智能的一个分支,旨在探讨数据分析与计算机算法的交集[8]。1959年,人工智能先驱Arthur Samuel定义机器学习是一个研究领域,让计算机无需进行明确编程就具备学习能力。该定义指出了机器学习的3个阶段,即数据预处理、模型训练和评估[9]。数据预处理阶段包括研究问题的确立、数据集建立以及训练集和测试集的划分。模型训练阶段包括监督学习、无监督学习以及强化学习3种学习方式,其中监督学习所需要的数据量与学习时间最少[10-11]。评估阶段是通过测试集验证生成的模型来确定模型性能优劣。
近年来,许多机器学习模型在医学数据处理、辅助诊断以及预后预测方面得到了广泛应用。目前常见的机器学习算法包括朴素贝叶斯、决策树、支持向量机、人工神经网络等(图1)。其中,决策树能够从一系列有特征和标签的数据中总结出决策规则,并以树状图结构呈现,可以解决分类和回归问题[12]。随机森林以及梯度提升器(eXtreme Gradient Boosting,XGBoot)是基于决策树模型的两种集成算法,通过对树的堆叠可以大幅提升模型应用性能[13]。支持向量机是近年来最受关注的机器学习算法之一,最接近深度学习,已被广泛应用于图像分类以及数据识别分类[14]。此外,传统统计学方法,例如逻辑回归和朴素贝叶斯,在机器学习模型相关研究中也有着广泛应用。人工神经网络是一种模拟人类神经元处理方式的机器学习算法,这一构想由McCulloch于20世纪40年代提出[15]。2006年, Hinton等[16]在其论文中展示了以最先进的精度识别手写数字的深度神经网络算法,并将这种技术称为“深度学习”。与简单的一层或两层神经网络相比,深度学习复杂的网络层次可以让算法学习更复杂的数据模式[17-18]。卷积神经网络是最常见的深度学习模型,其通过在图像中搜索简单特征并汇总,以得到更复杂的特征[19]。对于分类特征,卷积神经网络会为图像作出分类决策,并和已知的图像分类进行比较来得到误差[20]。通过这一训练过程,卷积神经网络可以更新其学习参数,并对新的图像作出分类决策[20-21]。
如今,随着深度学习的飞速发展,这项技术已经深入人们的生活,从网络浏览的智能推荐到语音识别、无人驾驶技术。近年来,其在医疗领域的应用也逐渐深入,尤其是在影像识别领域,有着广袤的应用前景。
2 机器学习在创伤骨科影像识别与诊断中的应用
骨科疾病的诊断极其依赖影像学证据,主要包括X线片、CT以及MRI。随着近年来深度学习算法的飞速发展,机器学习在影像识别领域展现出了广阔应用前景[20],尤其在创伤骨科,机器学习及其衍生成像技术在协助骨折诊断方面有着极高准确率[22]。在深度学习诞生之初,Brett等[23]便探讨了通过计算机影像识别技术标记椎体,并构建了识别非侧凸患者T4~L4椎体骨折模型。在卷积神经网络将ImageNet数据集120万张高分辨率图像准确分类之后,这一领域取得重大突破,深度学习逐渐成为最流行的机器学习技术[24]。
上肢骨折方面,Kim等[25]通过深度学习算法模型训练了11 112张桡骨远端骨折与正常的腕关节X线片,并进行了外部验证,其模型诊断特异度、灵敏度以及受试者工作特征曲线下面积(area under curve,AUC)分别为0.88、0.90、0.954,这一研究展示了卷积神经网络在识别桡骨远端骨折方面的应用前景。对于难以诊断的隐匿性骨折,临床医师往往会选择CT检查来进行排除,而深度学习算法可以有效发现隐匿性骨折,减少漏诊和过度检查。此外,Chung等[26]开发了一个基于卷积神经网络诊断肱骨近端骨折并识别其Neer分型的模型,结果显示该模型检测肱骨近端骨折准确性高,分型准确性达0.65~0.85;对于复杂的3~4部分肱骨近端骨折,其基于X线片诊断的准确性明显优于骨科及放射科医师。
下肢较上肢更容易发生隐匿性骨折,因此深度学习算法作为辅助诊断方式有着更大的潜在应用价值[27]。Urakawa等[28]的研究显示隐匿性髋部骨折发生率为4%~9%,为此他们设计了一个基于卷积神经网络诊断股骨转子间骨折的模型,使用了1 773张骨折影像以及1 573张非骨折影像,结果显示与矫形外科医师相比,深度学习模型有着更准确的判别。此外,Mutasa等[3]使用深度学习算法对127张GardenⅠ、Ⅱ型,610张Garden Ⅲ、Ⅳ型股骨颈骨折以及326张正常髋关节X线片进行建模,以期识别股骨颈骨折并进行Garden分型。结果显示,该模型识别骨折准确性为0.92、AUC为 0.92,骨折分型准确性为0.86、AUC为0.96。对于漏诊率较高的胫腓骨下段骨折以及足部骨折,Kitamura等[29]通过迭代298张骨折影像和298张正常影像,采用深度学习算法检测这些部位的隐匿性骨折,准确性达0.76~0.81。在CT识别及三维建模方面,汤小勇等[30]的研究显示在Mimics软件中通过人工智能辅助分割图像,可以大幅缩短膝关节三维模型建立时间,有助于提高放射科医师及骨科医师的诊断效率,并且这一系统在膝关节手术术前规划中也有着广阔应用前景。另外,有学者通过深度学习模型辅助CT断层影像进行跟骨骨折分型研究,同样有着很高的准确性[31]。
此外,在椎体骨折领域,临床医师通过影像学资料诊断椎体压缩性骨折的假阴性率为29.5%~46.5%[32]。Tomita等[33]使用卷积神经网络算法来识别和定位椎体骨折情况,研究共纳入1 432张CT影像进行训练,准确性为0.89。另外,Muehlematter等[34]基于58例脊椎不全骨折患者的CT资料开发了一个骨质分析结合机器学习的诊断模型,虽然该模型可以高精度识别不全椎体骨折,但是在分析单个椎体骨折发生风险时准确性较低。未来随着不同人群的CT影像样本增加,以及影像资料提取精确度提升,模型预测准确性有望进一步提高。见表1。
上述研究结果显示深度学习的影像识别性能与骨科及放射科医师相似,但在运算效率以及识别隐匿性骨折方面效能更佳。此外,骨折分型对治疗方案有着指导意义,随着算法效率以及影像资料数据量的提升,深度学习对骨折诊断和分型的精度也将逐渐提高。人工智能辅助诊断有利于临床医师快速确定诊疗方案、进一步优化医疗资源分配,带来巨大的社会和经济效益。
3 机器学习在创伤骨科临床决策及评估中的应用
与传统逻辑回归以及线性回归方法相比,许多机器学习算法可以识别非线性模型,从而提高预测结果准确性[35-36]。创伤骨科的复杂性决定了其临床治疗决策存在着较大可变性,近年来越来越多学者将机器学习算法应用到临床决策中[37-38]。机器学习算法建模以及临床转化流程见图2。
长期以来,创伤事件被认为是不可预测的。随着人工智能的飞速发展,一些模型被证明可以预测创伤事件发生概率。Dennis等[39]采用人工神经网络成功预测了多个创伤中心的患者容量和创伤事件发生高峰期,为创伤调度系统分配医疗资源提供了数据支持。此外,Stonko等[40]纳入了时间和天气因素来构建预测创伤事件数量、创伤严重程度以及急诊手术病例数的机器学习模型,该模型准确性高,有助于创伤管理关口前移并进一步合理分配医疗资源。
在跌倒及骨折风险评估方面,Kong等[41]比较了梯度提升算法CatBoost、支持向量机、逻辑回归以及骨折风险评估工具(WHO Fracture Risk Assessment Tool,FRAX)在预测骨质疏松症患者骨折风险方面的效果,结果显示CatBoost算法在预测脆性骨折方面显著优于FRAX(AUC 0.688 vs. 0.663,P<0.01)。此外,Forth等[42]通过机器学习算法分析了测力板所收集的老年人站立受力,通过建模得出姿势稳定性评分(postural stability,PS)(1~10),PS分数越高,稳定性越高,跌倒风险越低,通过算法分析得出的PS分数准确性为0.78。而作者的随访资料表明跌倒高风险人群(PS 1~3分)在1年内跌倒的可能性是低风险人群(PS 7~10分)的3倍。通过对老年人群跌倒风险的评估,可以快速识别跌倒高危人群及危险因素,从而达到“上医治未病”的预防效果。
创伤骨科患者治疗具有紧急和复杂性的特点,往往需要医师在急诊时对患者进行预处理,而机器学习算法作为辅助手段可以提高医师处理效率[43]。目前,这一领域的研究主要聚焦在对创伤患者病情及预后的评估。Liu等[44]开发了一种基于多参数机器学习算法和系统的模型,预测创伤患者对救生干预的需求,准确性达89.8%,为机器学习算法辅助急诊评估并干预创伤患者探索了应用可能。风险评估及预后预测方面,Cardosi等[45]通过回顾美国国家创伤数据库 2 007 485例创伤患者的临床数据,采用机器学习算法构建了创伤预测模型,分析不同患者的并发症风险和预后情况,模型AUC在0.85~0.87范围。接着,作者探索了这一创伤预测模型推广应用的可行性,认为该模型可以为医疗决策者提供决策支持。此外,Lee等[46]通过对创伤患者年龄组分类、严重程度选择和创伤相关变量的评分校准,提高了XGBoost算法预测创伤患者短期及长期预后的性能,并给出了影响患者预后的高危特征。
由于创伤的复杂性,如何获得标准化临床数据是机器学习在创伤骨科领域临床转化的关键。面对复杂多元的临床数据,我们可以通过机器学习算法进行数据清洗及归一化处理,以获得同质性数据用以建模。此外,积累大规模的临床数据将有助于进一步发掘和总结创伤骨科的临床规律,加速创伤骨科领域研究的进展。
4 机器学习在创伤骨科围术期与预后风险预测中的应用
近年来,许多研究聚焦了机器学习在创伤骨科患者围术期及术后长期并发症风险预测中的应用。Zhao等[47]比较了机器学习算法和逻辑回归等传统统计学方法在预测髋部骨折患者术后谵妄发生率及其危险因素的效果,结果显示XGBoost、支持向量机以及随机森林算法预测准确性在0.83~0.87之间,均高于逻辑回归。接着,作者综合了各个模型的特征重要性,确立了术前等待时间、血管加压药物的使用、虚弱指数、痴呆/卒中史、手术持续时间以及麻醉方式是导致髋部骨折患者术后谵妄最主要的6个危险因素。Li等[48]开发了一种基于机器学习的预测模型,以评估髋部骨折患者术后转入ICU、并发症发生以及延迟出院的风险,结果显示机器学习模型在预测术后ICU转科(0.835 vs. 0.692,P<0.01)、并发症发生(0.810 vs. 0.629,P<0.01)以及延迟出院(0.832 vs. 0.618,P<0.01)的准确性方面均优于美国麻醉医师协会全身状态分级系统(ASA-PS)。对于术后长期并发症,Klemt等[49]采用机器学习算法评估了人工全髋关节置换患者术后二次翻修的危险因素,判别、校准及决策曲线分析显示人工神经网络、随机梯度提升、随机森林和弹性惩罚逻辑回归 4种机器学习模型均取得了优异表现。通过机器学习方法对围术期并发症及其危险因素的识别,临床医师可以快速识别高危患者并及时处理,为优化围术期诊疗流程、降低并发症发生率提供了新的研究方向。
此外,在预测患者短期和长期预后方面,机器学习算法也有着很高的准确性。DeBaun等[50]比较了不同算法预测患者髋部骨折后30 d死亡率的性能,结果显示人工神经网络的AUC(0.92)最高,其次是逻辑回归(AUC 0.87)和朴素贝叶斯(AUC 0.83)。Forssten等[51]比较了支持向量机、朴素贝叶斯、随机森林以及逻辑回归算法预测髋部骨折患者术后1年死亡率的性能,结果显示前3种算法存在高估患者死亡率的可能,而逻辑回归在预测长期预后方面性能最优,这一研究肯定了传统统计学方法在预测预后方面的应用优势。
5 机器学习在创伤骨科临床应用中的挑战
随着科学技术的发展以及算法效率的提升,机器学习在医疗领域的应用逐渐深入[52]。在创伤骨科领域,机器学习算法作为一种辅助手段,在骨折诊断与分型、患者围术期护理及预后分析方面都有着广阔应用前景[53-54]。然而,在机器学习算法应用过程中仍存在一些挑战[4]。
第一,机器学习研究及应用的伦理原则。在机器学习研究及应用过程中,如何确保数据的准确性和隐私保护是值得关注的问题[55]。现阶段机器学习领域缺乏一个公认的伦理实践指导规范,但在研究过程中仍应确保科学性服从伦理性的原则。
第二,临床数据库中数据的质量和数量。训练的机器学习模型需要大量高质量数据,而创伤骨科患者的复杂性决定了收集的数据难以同时满足同质性和多样化两个需求,这就需要进一步扩大临床数据的样本量及样本特征数量,为模型拟合提供充足和多元的样本支持。
第三,机器学习模型的可解释性。机器学习模型对数据的拟合能力强于传统统计学方法,然而其带来的模型过拟合是一个绕不开的话题。强机器学习模型如深度神经网络等被视为“黑盒”,往往难以解释其结果及推理过程[56]。因此,如何评估机器学习模型的可解释性并构建解释性强的应用模型成为了一个亟待解决的问题。
第四,通用模型无法满足个性化诊疗需求。创伤骨科领域的临床实践需要高度个性化的治疗方案。由于临床医学并不是一门程序化科学,在创伤骨科领域,临床医师的主观能动性以及针对性治疗决策至关重要。每例患者的创伤类型、严重程度和生理状况各异,通用的机器学习模型可能无法完全满足个体化需求,开发针对个体患者的定制化算法和治疗计划将成为未来发展方向之一。
6 机器学习在创伤骨科临床应用的展望
尽管面临挑战,机器学习算法在创伤骨科临床应用中也呈现出巨大应用前景。创伤骨科的临床应用中,创伤类型的准确分类对于制定合理的治疗方案至关重要。通过对大量临床数据和影像数据的分析,机器学习模型能够识别和分类不同类型创伤骨折,从而帮助医生更准确地做出诊断和治疗决策,有助于缩短诊断时间,降低误诊率,提高患者的治疗效果。此外,通过分析患者的临床数据、生理指标以及影像数据,机器学习模型可以预测患者发生创伤的风险。基于这些预测结果,医生可以采取相应干预措施,减少患者发生创伤可能性。这对于高风险患者的管理和监控具有重要意义,从而达到“治未病”的目的。
院前,通过开发区域创伤系统,根据患者分布的地理位置空间来确定创伤中心的最佳位置以及高峰期创伤急诊的患者负荷,以期进一步合理配置创伤资源、降低单个创伤中心的负担[57]。Dooley等[58]介绍了基于需求的创伤系统评估工具,这一系统采用了地理空间建模,为地方创伤中心规划提供了证据支持,有助于评估区域内人口的创伤发生率、创伤中心覆盖率以及潜在的经济影响。
术前,临床医师可以通过机器学习模型分析患者影像数据,制定最佳手术计划。米尔阿地力·麦麦提依明等[59]采用人工智能术前规划系统在人工全髋关节置换术前进行假体型号预测,获得了较高的准确性和可重复性。此外,对于发生骶骨脆性骨折的老年患者,Kamer等[60]通过基于CT的人工智能三维建模来评估骶髂关节骨性通道,并在术前用以规划植入物位置。随着技术的进步,通过人工智能进行术前规划的精度也将逐渐提高,这有助于缩短手术医师学习曲线,使手术过程更加精确和安全,从而提高手术成功率,降低手术风险。
术中,通过机器学习算法进行精确定位以及人工智能增强现实技术可以辅助手术医师操作,降低手术难度。殷耀斌等[61]报道了1例机器人辅助四角融合经皮螺钉内固定病例,通过人工智能辅助定位实现了微创而精准的经皮四角融合,从而减少了透视次数及放射性暴露。另外,贾鹏等[62]报道了国产通用型骨科手术机器人天玑(TiRobot)在创伤骨科领域的应用,为骨盆髋臼骨折、髋部骨折、手足骨折等固定提供了微创化、智能化、精准化的解决方案。随着增强现实技术及人工智能的飞速发展,将进一步推动手术机器人的临床转化。
此外,术后康复作为创伤骨科不可或缺的一环,机器学习算法可以根据患者的临床数据和康复进展,为患者制定个性化康复方案。Santilli等[63]构建了4个基于决策树的集成模型,用于评估骨科及神经科患者出院后的康复计划改善患者功能的潜力。通过分析及检测患者的康复数据,模型可以预测康复进展,帮助医师做出及时调整,以最大程度提升康复效果。
综上述,随着近年来技术进步及算法效率的提升,机器学习在创伤骨科领域的应用渐广。机器学习算法在影像资料建模(即骨折识别)、诊断与分层,以及临床决策(包括跌倒与骨折预防、急诊处理、围术期与预后风险预测)等方面,均有着良好准确性。当前,机器学习在创伤骨科中的应用还处于研究与探索阶段,随着科技进步和数据量增长,机器学习模型的精度和应用价值将会大幅提升,在辅助诊断、指导决策、制定个性化医疗方案以及合理配置临床资源等领域有着广阔的应用前景。
利益冲突 在课题研究和文章撰写过程中不存在利益冲突;经费支持没有影响文章观点及其报道
作者贡献声明 田楚伟:文章撰写及修改;陈翔溆、朱桓毅:观点形成与综述构思;朱桓毅、秦晟博:文献检索;田楚伟、陈翔溆、石柳:文献筛选;芮云峰:选题指导与综述构思