帝国理工:如何用 AI 解决 80% 专科医生担忧的心律装置移植手术难题
数据集总共包括来自1575名患者的1676张不同设备的图像。尽管有66种不同的设备型号,但其中一些在视觉上是无法区分的,这可能只是设备中软件的变化。型号组共有45个,其中278张X光图像来自便携式设备,其余1398台为部门AP/PA片。 测试集45种型号中每种型号由5个样本组成,总共225个样本。 (左)条形图显示了识别5个人类报告者和神经网络中的设备制造商的比较准确性。p值是指中位数和最佳人类评分之上的神经网络的优越性。(右)混淆矩阵显示网络在预测正确的设备制造商时的准确性。BIO = Biotronik; BOS = Boston Scientific; MDT =美敦力; SOR =索林; STJ = St. Jude。 阶段1:不同神经网络架构的性能比较 对于所有的网络模型,经过阶段1的训练后,网络的性能都达到了一个稳定状态,损失函数也下降到一个平稳水平。VGGNet的准确率为4.4%,Xception的准确率为91.1%。 第一阶段的结论是为第2阶段选择Xception架构打下基础,并预先指定训练的epoch为15。然后第二阶段从一个全新的Xception神经网络开始,使用1451张完整的训练集进行训练。最后,使用第二阶段生成的最终神经网络对“测试集”数据进行测试验证。 阶段2: “测试集”验证神经网络性能 最终的神经网络识别设备制造商的准确率为99.6%,对应的F1得分为0.996。性能如图1所示。唯一错误分类的图像是Medtronic Adapta设备被误认为Sorin Reply设备。 不可避免地,识别模型组(而不仅仅是制造商)的性能较低,准确率为96.4% (95% CI: 93.1 ~ 98.5), F1评分为0.964分。值得注意的是,在其中的8个预测中,正确的型号是前3个预测中的1个。因此,通常描述为“前3名”的准确率为99.6% (95% CI: 97.5到100.0)。
便携式X光图像的型号识别准确率为89.5% (95% CI: 75.2 - 97.1),而部门X线图像的准确率为97.9% (95% CI: 94.6 - 99.4)(两组间差异p = 0.029)。然而,唯一的制造商分类错误是部门X光图像。起搏器组准确率为95.0% (95% CI: 90.4 - 97.8),ICDs组准确率为96.4% (95% CI: 87.5 - 99.6%)(两组间差异p = 1.00),准确率在不同厂家之间差异不显著(p = 0.954)。 与医学专家的性能进行比较 五名心脏病专家使用CaRDIA-X算法对5家制造商的225张测试集图像进行分类。他们的准确率从62.3%到88.9%不等,平均准确率为72.0%,神经网络的准确率显著高于专家。 可视化分析 在另一项探索性分析中,我们对测试集中的每张图像都生成了特征图,显示它们所描述的心率仪的最大特征,就类似于临床医学中疾病的病征。 图3显示了包含2个不同型号的4幅图像,图4表明AT500设备的特征映射,显示围绕该设备特有的环形电路板组件。
讨论 这是首次利用人工智能从X光图像中识别心律装置的研究。该神经网络在识别设备制造商方面具有更高的准确性。对于从未见过的图像,该网络识别设备制造商的准确率为99.6%,对应的专家识别准确率为62.3%到88.9%。 临床应用 (编辑:西安站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |