Radiology:人工智能在髋关节骨关节炎影像学特征严重程度分级中的应用
时间:2021-05-06 06:02:16 热度:37.1℃ 作者:网络
骨关节炎是最常见的慢性疾病之一,全世界有超过2.3亿人受其影响。骨关节炎是一种全关节疾病,最常见于中老年人群的膝关节和髋关节。髋关节骨性关节炎的诊断和严重程度分级依赖于各种临床和影像学表现。骨盆x线片是怀疑有髋关节骨关节炎的患者最常用的影像学检查手段。髋关节骨关节炎的x线特征包括关节间隙狭窄(JSN)、骨赘、软骨下硬化、软骨下囊肿和股骨头塌陷。然而,对这些特性的准确评估十分繁琐且需具备相关的专业知识,因此对于缺乏经验的阅读者来说极富有挑战。
人工智能在临床常规影像学诊断中的潜在价值仍有待研究。先前已有研究证明了基于深度学习算法评在x线片上评估髋骨关节炎的可行性。然而,在临床实践中,对受累关节疾病严重程度的评估是评估患者治疗的关键。Kellgren-Lawrence评分是对各种相关影像学骨关节炎特征的浓缩分级。对于影像学所表现的膝关节骨关节炎,已有研究利用Kellgren-Lawrence评分探讨了深度学习对x线片上的疾病严重程度进行分类的潜力。
近日,发表在Radiology杂志的一项研究开发并验证了一种多任务深度学习模型,该模型可从x线片自动提取髋关节骨关节炎的影像学特征,特别是股骨骨赘(FOs)、髋臼骨赘(AOs)、JSN、软骨下硬化和软骨下囊肿,并将其性能与主治放射科医生的性能进行了比较,为临床对髋关节骨关节炎患者个性化治疗方案的制定提供了有价值的参考依据。
本项回顾性研究对骨关节炎倡议(OAI)参与者的负重骨盆前后位的x线片进行了评估。从2004年2月到2006年5月招募参与者进行基线测量,并在48个月后进行随访。股骨骨赘(FOs)、髋臼骨赘(AOs)和关节间隙狭窄(JSN)根据国际骨关节炎研究协会分级为缺如、轻度、中度或重度。并记录了软骨下硬化和软骨下囊肿的有或无。用分裂样本验证将参与者分为训练集、验证集和测试集,分别位80% (n = 3494)、10% (n = 437)和10% (n = 437)。多任务神经网络以DenseNet-161为基础(DenseNet-161是一个使用多任务损失函数训练的共享卷积特征提取器)。
本研究共纳入4368名参与者(平均年龄61.0岁±9.2岁[标准差];2538例女性),并对4368名参与者的7738张负重骨盆前后位片上的15364个髋关节进行了评估。在内部测试集中,用于评估这五个特征的模型的准确性对于FOs而言是86.7%(1333/1538),AOs为69.9%(1075/1538),JSN为81.7%(1257/1538),软骨下硬化为95.8%(1473/1538),软骨下囊肿为97.6%(1501 1538);在外部测试集中用于评估这五个特征的模型的准确性对于FOs而言是82.7%(86/104),AOs为65.4%(68/104),JSN为80.8%(84/104),软骨下硬化为88.5%(92 104),软骨下囊肿为91.3%(95/104)。
图1 深度学习模型在骨关节炎倡议测试集上的诊断性能。A、骨关节炎影像学特征的受试者工作特征曲线:股骨骨赘(FOS)、髋臼骨赘(AOS)、关节间隙狭窄(JSN)、软骨下囊肿(SUBCYST)和软骨下硬化(SUBSCL)。FOSDE 受试者工作特征曲线下面积最高(0.94)。B,深度学习模型的混淆矩阵。总体准确性为86.7%(1333/1538),线性加权Cohen k值为0.62(95%置信区间:0.49,0.76)。大多数评分差异发生在两个相邻的评分之间,而只有0.3%(1538例中的4例)的病例显示出了非相邻评分之间的差异。
图2 骨关节炎影像学特征评估热图。A、B,关节间隙中度狭窄(箭头)。B热图显示,在确定关节空间狭窄时考虑了整个关节空间区域(箭头)。C、D,髋臼软骨下囊肿(箭头)。热图显示,神经网络的注意力集中于这一区域。
综上所述,本研究证明了多任务深度学习方法在x线片上对髋关节骨性关节炎特征进行分级的可行性,同时证明了其性能与放射科医生相当。本研究所提出的多任务深度学习模型可用于大型流行病学研究中的髋关节骨性关节炎特征的结构性评估,为临床进行快速、准确的评估提供了技术支持。
原文出处:
Claudio E von Schacky,Jae Ho Sohn,Felix Liu, et al.Development and Validation of a Multitask Deep Learning Model for Severity Grading of Hip Osteoarthritis Features on Radiographs.DOI:10.1148/radiol.2020190925