- +1
研究显示医生在临床推理方面仍然优于人工智能

研究显示,AI虽能通过医学考试,但是在临床案例真实推理中表现不佳,尤其不擅长根据新信息更新判断及识别无关信息,存在过度自信风险,目前的AI还不能“替代”医生辅助诊断疾病。关注详情。
阅读文摘
一项研究指出,尽管人工智能(AI)在医学资质考试中表现卓越,但在面对患者动态的、不确定的真实临床案例及推理时,仍面临挑战。
该项研究利用名为“concor.dance”的基准测试工具(基于医学教育中常用“脚本一致性测试”)评估了主流大型语言模型的临床推理能力。测试模拟了医生如何根据新症状和检查结果,在不同诊断假设之间灵活地切换并筛选关键信息,最终确诊疾病。
研究还发现,AI模型的表现大约相当于低年级医学生(不是低年资医生),远未达到资深医生的临床诊疗水平。其核心缺陷在于:难以根据新的、不确定或不完全信息更新判断。AI也经常无法识别哪些是无关信息,测试中约30%的干扰信息会被AI错误关联。
更令人担忧的是,旨在让AI更“有用”的优化反而加剧了其“过度自信”问题,使其能极具说服力地解释错误的诊断。
研究人员认为,通过医生资质考试与进行临床诊疗推理,其实是两种不同技能。
研究结论:目前的AI无法“替代”医生对疾病的诊断或病情判断,AI技术仍在持续发展。因此,医学界有责任积极参与,确保其被改进得安全、有效且符合患者利益,而不是被动接受其临床应用。

原标题:《研究显示医生在临床推理方面仍然优于人工智能》
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。





- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2026 上海东方报业有限公司




