- +1
上海交大刘成良教授团队研发“心电大模型”:面向全人群的自动心电图诊断系统
原创 Cell Press CellPress细胞科学

医学
Medicine
2024年12月17日,上海交通大学刘成良教授团队在Cell Press细胞出版社期刊Cell Reports Medicine上在线发表题为“Foundation Model of ECG Diagnosis: Diagnostics and explanations of any form and rhythm on ECG”的研究论文,该研究提出了心电图诊断大模型(KED),在中国、美国和其他地区的所有年龄人群中,KED对心电图形态异常、节律异常、传导阻滞、房室肥大、心肌缺血和心肌梗死显示出了高精准度的诊断性能。
根据世界卫生组织的报道,心血管疾病是全球死亡的主要原因,因此早期识别高危人群至关重要。心电图(ECG)因其便捷、经济且无创的特点,每年用于超过3亿人次的检测,是从健康筛查到重症监护等各种临床环境中,用于早期诊断和评估心血管疾病的重要工具。有研究表明,即便是经验丰富的心内科医生,解读复杂的心电图仍然耗时且容易出错。在偏远且医疗资源匮乏的地区,由于专业医生稀缺,提供准确诊断更为困难。人工智能(AI)在心电图诊断中的应用显示出巨大的潜力。研究显示,基于AI的心电图诊断在某些特定疾病的识别上已经超过普通医生。此外,医生使用AI辅助诊断显著提高了判读效率和准确性。然而,由于缺乏高质量的大规模标注数据以及传统深度学习模型架构的限制,导致现有的心电图自动诊断系统大多集中于少数几种特定疾病的诊断。而且这些研究仅针对特定人群进行评估。人群特征的多样性、疾病的广泛性和复杂性,使得现有AI模型在实现通用普适和广泛覆盖各种疾病上面临巨大挑战。因此,为确保AI诊断系统在各种医疗环境中普遍适用,并使心电图诊断不完全依赖于医生的水平,开发一种基于大规模数据训练的高精准度大模型至关重要。
针对上述问题,团队提出了一种知识增强的心电诊断大模型(KED),该模型根据80万份患者的心电图进行训练。KED中首先引入了一个知识增强策略,通过利用大型语言模型来整合心电信号的领域特定知识,从而提高模型的泛化能力和在各种场景中的稳定性。KED的模型架构由四个模块组成:心电信号编码器、医学知识编码器、标签查询网络和分类头。心电信号编码器负责将原始信号编码为特定维度的表示向量,知识编码器则将医学报告或标签文本编码为相应的表示向量。标签查询网络在接收到标签和心电图编码后,输出标签查询结果的编码;分类头根据标签查询结果的编码,输出对应疾病在心电图中存在的概率。此外在训练阶段,团队提出了一种新的对比学习算法——增强信号-文本-标签对比学习(AugCL),将医学文本知识整合到ECG信号学习中,以缓解标签的噪声问题。
KED在包括中国、美国和其他地区的人群中表现出了优异的诊断性能。KED适用于所有年龄组的心电图形态异常、节律异常、传导阻滞、房室肥大、心肌缺血和心肌梗死等各种情况的诊断,例如,房颤诊断的受试者工作特征曲线下面积(AUC)为0.994、灵敏度为0.949、特异性为0.975,左束支传导阻滞的AUC为0.972、灵敏度为0.904、特异性为0.994,前间隔心肌梗死的AUC为0.927、灵敏度为0.740、特异性为0.914,室上性心动过速的AUC为0.928、灵敏度为0.726、特异度为0.911,前外侧壁心肌缺血的AUC为 0.764,灵敏度为0.496,特异度为0.841等。另外,通过与经验丰富的心内科医生在真实临床数据集上的对比,该模型对常见的临床心电图类型均达到了与三甲医院医生相当的诊断性能。总之,这一研究结果表明,KED不受地理、种族、年龄、性别或ECG采集设备差异的影响。它能够在多种场景下诊断心律失常、心梗等各种疾病,对于在医疗资源匮乏和不发达地区进行辅助医生诊断和早期快速精准筛查具有重要的应用价值。

作者专访
Cell Press细胞出版社特别邀请刘成良教授进行了专访,请他为大家进一步解读。
CellPress:
心电大模型KED相对于现有的AI模型有什么优势或创新?为什么KED能取得优越的诊断性能?
刘成良教授:
传统的图像或信号监督模型经过训练后,只能预测一组固定的预定义类别。这种架构扩展性差,遇到新类别时需要重新训练或微调模型。在KED中,我们提出了一种信号-语言模型的新架构,该架构利用医学文本的丰富语义来指导模型学习,使KED不仅局限于训练时学习过的疾病,还能诊断更多的疾病。而之所以KED能取得优越的诊断性能,得益于我们提出的知识增强方法和信号-文本-标签对比学习算法。首先,我们在模型训练和部署诊断阶段引入大型语言模型,并利用外部医学知识来增强封闭域模型,从而显著提高模型的诊断性能和泛化能力。此外,对比学习是一种主流的模型预训练方法。传统对比学习方法适用于单标签分类任务,但在处理多标签问题(如心电图诊断)时,通常会引入噪声标签,导致学习性能下降。为了解决这一问题,我们提出了一种新的对比学习算法。该算法通过对标签维度进行升维,并引入一组可学习参数来解耦多标签,从而减少噪声影响。总之,我们提出的信号-语言模型架构、知识增强方法和增强信号-文本-标签对比学习算法,使得我们在心血管疾病诊断上精度更高、疾病种类更多、适用性更广。
CellPress:
心电大模型KED致力于服务偏远和医疗资源不足的地区,那KED现在是否有部署应用,应用情况怎么样?
刘成良教授:
我们团队一直致力于前沿科技成果的转化和落地,为此我提出了“智能在端-智慧在云-管控在屏”的理念,这一理念支撑了我们在智慧医疗和机器健康领域的科研及成果应用。我们最新发布的心电大模型KED是“智慧在云”的核心部分,也就是我们常说的“云医生”。实际上我们这一套完整的系统已经为六万多人提供心电图快速监测、辅助诊断服务。并被广泛应用于交通运输、建筑、物业、矿业、企业工会、养老院、基层社区和医院等领域。这次发布的心电大模型KED经过我们在中国、美国和其他地区的不同人种,以及所有年龄段人群中的充分验证和评估,在对各种心律失常、心电图形态变异、房室肥大、心肌缺血和心肌梗死的诊断中表现出优越的性能。这为我们进一步地为更广泛的人群提供精准的心电图快速诊断奠定了重要基础。
CellPress:
目前在医学大模型领域还有哪些值得探讨的方向?
刘成良教授:
医学大模型是目前医学人工智能最前沿、关注度最高的领域,并在心电图、胸部X光、眼底图像及组织病理图像等应用场景中取得了显著进展。然而,与专科医生相比,这些模型仍存在显著差距。我认为可以从以下两个方向进一步推动医学大模型的研究。首先,我们需要开发新一代融合多种模态的大模型架构。这些架构应能够整合心电图、超声、CT、X光片、MRI、WSI、生化检查及电子病例等各种模态的数据,而不仅限于目前的文本和特定影像模态。单一模态在疾病诊断和评估中存在局限性,而医生通常通过综合分析患者的多种检查结果来进行临床决策,现有的大模型尚未达到这一水平。其次,个性化医疗健康大模型的研究是一个非常值得关注的方向。当前的医学大模型通常关注于通用的诊断和预测,然而每个患者的生理特征、生活习惯和遗传因素都不同。为了实现更精准的个性化医疗服务,我们需要开发能够为每个个体量身定制的“云医生”。这样的系统需要我们构建并实时分析包括日常活动、饮食、基因信息和环境因素等个人云端大数据,从而提供个性化的疾病预防、诊断和治疗建议。

作者介绍

刘成良
教授
通讯作者:刘成良,上海交通大学讲席教授、长江特聘教授、机电控制研究所所长,上海智能制造研发与转化功能平台总工程师。“十二五”国家 863 计划先进制造技术领域智能机器人主题专家、国家重点研发计划“智能机器人”重点专项总体专家组副组长、上海市领军人才、上海市优秀学科带头人。以第一完成人获国家科技进步奖二等奖2项、中国机械工业科学技术特等奖1项、省部级一等奖3项。主持国家重点研发计划项目、国家自然科学基金重点项目、973课题、国家863重点项目、国家重大科技成果转化项目等30余项。发表论文440 余篇,授权发明专利 160 余项。主要研究方向:机器健康与智能运维、AI+医学诊断。

田圆圆
博士研究生
第一作者/共同通讯:田圆圆,上海交通大学机械与动力工程学院博士研究生,主要从事心电大模型,可解释视觉-语言模型,基于多模态数据的多系统疾病诊断、健康评估和风险预测等研究。参与国家重点研发计划、国家自然科学基金、上海市人工智能重大专项等各类科研课题多项。参与建设“智能在端-智慧在云-管控在屏”远程心脏健康监护、预警分布式微服务系统,参与开发“心狗云医生”系统、三脑融合(云脑-机脑-人脑)家用健康服务机器人系统。
相关论文信息
论文原文刊载于Cell Press细胞出版社旗下期刊Cell Reports Medicine,点击“阅读原文”或扫描下方二维码查看论文
▌论文标题:
Foundation Model of ECG Diagnosis: Diagnostics and explanations of any form and rhythm on ECG
▌论文网址:
https://www.sciencedirect.com/science/article/pii/S2666379124006463
▌DOI:
https://doi.org/10.1016/j.xcrm.2024.101875
CellPress细胞出版社

CRMed:刘卓炜团队构建转移性睾丸癌化疗后腹膜后残留病灶病理结局的多模态预测模型 | Cell Press对话科学家
原标题:《上海交大刘成良教授团队研发“心电大模型”:面向全人群的自动心电图诊断系统 | Cell Press对话科学家》
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。





- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2025 上海东方报业有限公司