J AM COLL RADIOL:如何仅仅从胸片预测患者的人口统计数据? 

时间:2023-10-17 20:31:39   热度:37.1℃   作者:网络

随着技术的快速发展人工智能(AI)已经迅速渗透到现代社会的各个方面。从决定谁被雇用、获得抵押贷款或有资格获得医疗服务,算法已经越来越多地做出重要决定。然而,不同行业的人工智能模型表现出与性别、种族和年龄有关的偏见。这方面的例子包括在语言翻译中加入性别定型观念无视皮肤颜色较深的病人的皮肤癌病变以及将非裔美国人的面孔误认为是罪犯。

在放射学领域,算法在做出重要的医疗决定方面正发挥着越来越大的作用。例如,病人是否正在经历急性出血性卒中或肺栓塞以及其他许多例子。然而,许多模型是在医疗图像数据库上训练的,这些数据库不能很好地代表人口的多样性。反过来,许多人工智能模型对于代表性不足的人群可能表现得不那么好。

深度学习技术的最新进展使研究人员能够 "窥视黑箱",了解人工智能算法如何对图像进行分类。这种"可解释的人工智能"方法试图揭示深度学习模型如何得出预测结果。例如,创建一个视觉热力图或称显著性图,突出图像中影响模型决策的区域。这些方法可以增加对人工智能模型的信心防止数据的过度拟合并确保决策的有效性。此外,这些技术可以以探索性的方式使用。

虽然人们已经认识到需要检测和减少医疗人工智能数据集中的偏见,但为此开发的应用有限。据我们所知还没有任何系统可以检测已发表的医学成像数据集的人口统计学特征,包括年龄、性别、种族和保险状况。


近日,发表在J AM COLL RADIOL杂志的一项研究创建了一个人工智能模型并对其进行了评估,以实现从给定的胸片中对个别病人的自报性别、年龄、自报种族和保险状况进行分类。

本项研究使用MIMIC胸部X光(MIMIC-CXR)数据库中的55174张X光片对模型进行了训练和测试。外部验证数据来自两个独立的数据库,一个来自CheXpert,另一个来自一个经过机构审查委员会批准的多医院城市医疗系统。宏观平均的曲线下面积(AUC)值被用来评估模型的性能。

模型预测性别的准确性几乎是完美的,在保留的测试数据上有0.999(95%置信区间:0.99-0.99)的AUC,在外部验证数据上有0.994(0.99-0.99)和0.997(0.99-0.99)。预测年龄和种族的准确性很高,AUC从0.854(0.80-0.91)到0.911(0.88-0.94)不等;预测保险状况的准确性适中,AUC从保持测试数据的0.705(0.60-0.81)到外部验证数据的0.675(0.54-0.79)。 


 
图  按各种人口统计学分组的Grad-CAM热图。(A) 自我报告的种族:亚裔、非裔美国人、西班牙裔或拉丁裔、白人。热图强调了自认为是非裔美国人的患者的双侧肺尖,以及自认为是亚裔的患者的颈部气管。(B) 保险状况:医疗保险、医疗补助、其他(私人)。热图并没有显示出对任何一个感兴趣的区域的关注。(C) 自我报告的性别:女性或男性。热图突出了图像底角的重要性,在乳房阴影的层面上。(D) 年龄:20岁、30岁、40岁、50岁、60岁、70岁、80岁。热力图突出了胸骨关节作为有影响的关注区域

本项研究创建了深度学习模型,该模型从胸部X光片中预测性别、年龄和种族,并且非常准确。这些模型可用于大型胸部X光片数据库的质量控制,以确保在开发未来的深度学习模型时各种人口统计学得到平等的体现。这项技术也可用于协助识别未识别的病人,特别是年龄。同时也可以用来填补大量出院病人的人口统计学数据的缺失。

原文出处:

Jason Adleberg,Amr Wardeh,Florence X Doo,et al.Predicting Patient Demographics From Chest Radiographs With Deep Learning.DOI:10.1016/j.jacr.2022.06.008

上一篇: 尿酚检测,你了解多少?

下一篇: 当代心脏外科中心——“快通道心脏麻醉”为...


 本站广告