下载客户端

研究显示医生在临床推理方面仍然优于人工智能

2025-12-01 06:19

来源：澎湃新闻·澎湃号·湃客

听全文

研究显示，AI虽能通过医学考试，但是在临床案例真实推理中表现不佳，尤其不擅长根据新信息更新判断及识别无关信息，存在过度自信风险，目前的AI还不能“替代”医生辅助诊断疾病。关注详情。

阅读文摘

一项研究指出，尽管人工智能（AI）在医学资质考试中表现卓越，但在面对患者动态的、不确定的真实临床案例及推理时，仍面临挑战。

该项研究利用名为“concor.dance”的基准测试工具（基于医学教育中常用“脚本一致性测试”）评估了主流大型语言模型的临床推理能力。测试模拟了医生如何根据新症状和检查结果，在不同诊断假设之间灵活地切换并筛选关键信息，最终确诊疾病。

研究还发现，AI模型的表现大约相当于低年级医学生(不是低年资医生），远未达到资深医生的临床诊疗水平。其核心缺陷在于：难以根据新的、不确定或不完全信息更新判断。AI也经常无法识别哪些是无关信息，测试中约30%的干扰信息会被AI错误关联。

更令人担忧的是，旨在让AI更“有用”的优化反而加剧了其“过度自信”问题，使其能极具说服力地解释错误的诊断。

研究人员认为，通过医生资质考试与进行临床诊疗推理，其实是两种不同技能。

研究结论：目前的AI无法“替代”医生对疾病的诊断或病情判断，AI技术仍在持续发展。因此，医学界有责任积极参与，确保其被改进得安全、有效且符合患者利益，而不是被动接受其临床应用。

原标题：《研究显示医生在临床推理方面仍然优于人工智能》

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

澎湃矩阵

新闻报料

互联网新闻信息服务许可证：31120170006

增值电信业务经营许可证：沪B2-2017116

反馈