贾静雯古装图片使用面部图像通过深度学习(卷积神经网络)建立插管难度分类人工智能模型:一项观察性研究
气管插管是确保气道安全的金标准,在重症监护室和急诊室遇到插管困难的情况并不少见。
气管插管是确保气道安全的金标准,在重症监护室和急诊室遇到插管困难的情况并不少见。目前,对于不熟悉气管插管的医生、住院医师和医护人员来说,需要一种客观的方法来评估紧急情况下的插管困难。人工智能(AI)由于其先进的性能,目前被广泛用于医学成像。我们旨在创建一个AI模型,使用卷积神经网络(CNN)从面部图像中对插管困难进行分类,该模型将患者的面部图像与实际插管难度联系起来。
排除标准:年龄小于20岁,头面颈部有手术史的患者(神经外科、心脏外科、鼻腔外科、牙科、眼科、甲状腺、颈椎和食道手术),行气管插管的麻醉医生临床经验不满3年;初次插管时医生未使用MaCintosh喉镜;使用其他设备插管、使用声门上气道设备、患有痴呆或无法遵循指示动作、患有精神障碍以及因参与其他研究而无法参与本研究。
作者收集了术后第二天患者的年龄、性别、体重指数、基础疾病、MPC、IIG、TMD、HLM、BT、ULBT等人口学资料,并对16种体位进行了面部图像采集。所有这些图像都以JPEG格式保存,并调整为512px×512px以减少过多的功能和计算复杂性。
本研究依Cormack-Lehane分级分为非插管困难组(简单组,Ⅰ级和Ⅱ级)和插管困难组(困难组,Ⅲ级和Ⅳ级)。在获得的图像中,80%作为训练数据,其余20%作为测试数据进行推理评估。为了避免模型的过度学习,对训练数据进行了扩展,将训练数据从0.7次扩展到1.3次,纠正了简单组和困难组之间病例数量的偏差。
本研究的模型是在VGG16的13个卷积层的基础上增加一个卷积层来建立的,输出的是输入图像是否为简单/困难图像。训练模型后,利用预分割图像数据集(测试数据)进行推理评估,验证了预测插管难度的准确性。采用二次交叉熵作为损失函数,Adam作为优化方法,机器用10-30个时期和16-32个批次训练模型。评价指标是测试数据的准确性、敏感性、特异性和根据ROC曲线计算的AUC。生成AI模型后,利用图像数据集,用梯度类激活图(Grad-CAM)对模型的评价估域进行可视化,进行推理评价。
类激活热图是根据简单/困难分类的结果计算每个区域的重要性而生成的二维图像,热图上的红色和黄色区域表示AI模型认为对简单/困难分类很重要的区域。将用于推理评估的图像的类激活热图中的每个像素的RGB值(红、绿、蓝值)进行组合和平均,分别为简单组和困难组创建单个图像(RGB平均图像)。
为了减少随机划分图像数据进行训练和推理评估所造成的数据偏倚的影响,我们进行了五重交叉验证。此外,在创建这五个数据集时,我们使用k折交叉验证来避免简单组和困难组的分布存在任何偏差。我们在每个数据集上对模型进行训练和评估,并计算每个数据集的AUC,AUC的中位数显示为每个图像模型的结果。
从2020年4月10日(UMIN注册开始日期)到2020年8月31日,共有1043名患者计划在全麻下进行手术。其中752名患者被排除在外,75名未获得患者同意,9名患者缺少Cormack-Lehane分级的数据,还有两名患者为同一人。共有838名患者被排除在外,205名患者符合条件。此外,排除了两名数据较差的患者(一名患者由于头发的存在而无法识别面部轮廓,另一名患者的图像未对焦)和一名因成像设备问题而丢失图像的患者。最后,共有202名患者被纳入分析。
202例患者中,男性92例,女性110例,平均年龄63.9±14.2岁。根据ASA分级,15.8%为ASA Ⅰ级,67.8%为ASA Ⅱ级,16.3%为ASA Ⅲ级。麻醉医生的工作年限在全麻期间给病人插管的年龄为11.2±6.9年。本研究的手术类别详见表2。此外,26.7%的病例被认为插管困难。
易插管患者与难插管患者的数据差异为3:1。在对患者面部图像进行机器学习之前,20% 的数据被保存为测试数据。以KFOLD1为例,将简单组30幅图像和困难组11幅图像保存为测试数据(占总图像的20%),简单组剩余的118张图像和困难组剩余的43张图像用作训练数据(占总图像的80%)。在训练数据中,简单组扩大了3次,困难组扩大了9次。最终,简单组有354条训练数据,困难组有387条训练数据。
图6显示了仰卧侧闭口基位的学习曲线。黑线表示训练数据,灰线表示测试数据。测试数据和训练数据的学习曲线一致,说明AI模型学习正常。
数据集1中仰卧侧闭口基位的AI模型在epoch 20时的准确率为80.5%(表4)。根据AI模型的预测绘制ROC曲线,对实际插管困难程度进行分类,并将其与从患者面部图像获得的插管困难程度相联系,计算了灵敏度、特异性和 AUC(表5)。AI模型的AUC用于分类从患者面部图像获得的插管困难程度,范围为0.387[0.168-0.605]到0.864[0.731-0.969]。仰卧侧闭口基位AI模型的最大AUC为0.864[0.731-0.969],准确度、敏感性和特异性分别为80.5%、81.8%和83.3%(图7)。仰卧侧张口基位AI模型的AUC为0.758[0.594-0.921],仰卧侧闭口后弯位AI模型的AUC为0.727[0.568-0.886],即足以诊断插管困难。
在使用Grad-CAM进行仰卧侧闭口基位的类激活热图中,容易插管的图像中,视点往往集中在颏尖到喉部的区域,而在困难插管的图像中,没有特定区域的视点集中。在RGB平均图像中,简单组的视点倾向于从颏尖到喉部的区域,而困难组的视点倾向于分散(图8,9)。
根据本研究中患者插管困难的各种预测因素和实际插管困难的存在或不存在构建ROC曲线,并计算敏感性、特异性和AUC(表6)。插管困难的各种预测因子的AUC范围从 0.558 [0.467-0.649] 到 0.673 [0.595-0.750],其中Mallampati分级是最大的预测因子。至今还未没有发现能够区分困难插管各种预测因素的单个指标。而基于仰卧侧闭口基线图像的人工智能插管困难分类模型AUC为0.864[0.731-0.969],准确率为80.5%,敏感性为81.8%,特异性83.3%,说明该模型具有足够的诊断能力。
利用利用深度学习识别困难气道,我们可以更大规模地开展临床研究,不断完善困难气道热图数据库。机器学习便于包括麻醉科、ICU和急诊科医生在内的临床医生预判插管困难患者,提前安排有较丰富的紧急气道建立经验的医生进行气道建立,可大大提高需紧急气道建立患者的生存率,避免无效插管延误抢救时机。不足之处在于,仅纳入山形大学医院择期手术成人患者为研究对象,一是降低了困难插管患者的比率,二是缺乏儿童及高龄受试者,三是图像采集局限于单中心研究受试患者的容貌特征,因而研究结果缺乏代表性和普遍性。因此,开展多中心临床研究以期建立更完善的困难气道识别热图数据库的重要性不言而喻。
|