HISTOPATHOLOGY:ChatGPT和组织病理学家在病理诊断和协作潜力方面的比较分析
时间:2023-12-11 14:39:34 热度:37.1℃ 作者:网络
ChatGPT于2022年11月推出,是由OpenAI研究实验室开发的人工智能(AI)聊天机器人。它使用强大的语言模型Geneserative Pretrained Transformer(GPT)来促进自然语言的推理和组成。ChatGPT在医疗保健中的早期适应已经证明了其潜力,从通过转录临床笔记到作为虚拟助理来改善医患对话中的同理心,以及作为诊断任务和治疗决策的高级直观的临床决策支持系统(CDSS)。
ChatGPT因其在各种标准化医疗检查中的表现而引起了主流媒体和医学界的极大关注。例如,最近的一项研究报告称,ChatGPT能够在几个知识领域提供事实准确和上下文相关的答案,并在虚拟专家妇产科客观结构化临床检查(OSCE)中优于人类候选人。然而,ChatGPT在严重依赖视觉解释的组织病理学领域的表现如何仍然未知。
此前,已经描述了ChatGPT在病理学医学教育中的应用,这表明它有能力解决更高阶推理问题。然而,尚未进行评估ChatGPT作为解决常规组织病理学报告期间遇到的常见诊断挑战或其在复杂病例中作为CDSS潜力的一般参考的实用性。ChatGPT的表现在多大程度上与病理学家的评估一致也仍然未知。
2023年11月30日发表在HISTOPATHOLOGY的文章,旨在衡量ChatGPT在诊断组织病理学中的表现,并评估病理学家和ChatGPT之间的合作潜力,以提供更准确的诊断。
在研究的第一部分中,病理学家和ChatGPT面临了一系列问题,包括组织病理学中常见的诊断难题。对于第二部分,病理学家回顾了一系列具有挑战性的虚拟幻灯片,并在咨询ChatGPT之前和之后提供了诊断。
研究结果显示,ChatGPT在获得正确诊断方面的表现不如病理学家。与ChatGPT的咨询提供了有限的帮助,ChatGPT生成的信息取决于病理学家提供的提示,并不总是正确的。最后,本文调查了对ChatGPT诊断准确性评价很差的病理学家,但发现它作为高级搜索引擎很有用。
测试后调查的结果评估了病理学家在组织病理学中对ChatGPT的看法和情绪
综上所述,本文对ChatGPT在常规组织病理学实践中的效用进行了首次广泛调查。这项研究引起了人们对将ChatGPT纳入日常组织病理学实践的担忧,因为我们强调了ChatGPT在常规组织病理学诊断中犯的错误,类似于它可能如何获得医学问题“惊人错误”。ChatGPT也可能使用错误的推理来得出正确答案。ChatGPT被描述为“知道很多,但危险在于它在很大一部分时间里是自信和错误的”。此外,ChatGPT缺乏对数学知识的真正理解。
由于无法执行数学任务,并且作为下一个令牌预测机器的功能有限,ChatGPT纯粹在语言层面上响应提示,而不是病理学家用来排除/包括鉴别诊断的统计/贝叶斯模型。它只生成下一个单词,并且没有修改或修改其先前输出的机制,从而导致线性论证方法。此外,在本研究中,重新生成相同问题的提示导致了ChatGPT的不同答案。这引起了人们对所提供信息的可重复性和一致性的担忧。例如,当提出相同的问题或答案再生时,会给出“径向疤痕”和“管状腺瘤”等答案,而不是“硬化性腺病”。
参与者之间的共识表明,ChatGPT可能会被假阴性和假阳性结果所误导,例如异常的免疫组织化学染色或误导性的临床情景。受访者强调了审查和验证ChatGPT提供的信息的重要性,而不是盲目接受它。一篇社论甚至指出,ChatGPT“不能被信任来获取事实或产生可靠的参考”。
此外,ChatGPT虚构和参与“幻觉”的趋势是众所周知的。通过ChatGPT生成虚假引用列表是可能的,因为它的基础设施不会将事实与虚构分开,并根据其训练集中统计学上最可能的下一个最佳词产生产出。当信息不存在时,ChatGPT试图使用其掌握的数据产生答案的最高持续概率,该可能是错误的/虚构的。
原始出处
Oon, M.L., Syn, N.L., Tan, C.L., Tan, K.-B. and Ng, S.-B. (2023), Bridging bytes and biopsies: A comparative analysis of ChatGPT and histopathologists in pathology diagnosis and collaborative potential. Histopathology. https://doi.org/10.1111/his.15100