下载客户端

人工智能辅助乳腺X线筛查安全，可使放射科医生的工作量近乎减半

2023-08-08 12:17

来源：澎湃新闻·澎湃号·湃客

原创柳叶刀柳叶刀TheLancet

《柳叶刀-肿瘤学》（The Lancet Oncology）发表一项人工智能辅助乳腺X线筛查中期安全性分析研究，涉及8万多名瑞典女性，这是关于此类研究的首项随机对照试验。研究表明，AI辅助的乳腺X线分析在检测乳腺癌方面的效果不亚于两名乳腺放射科医生的合作，且不会增加假阳性，并使读片工作量几乎减半。识别二维码或点击文末“阅读原文”，阅读研究原文。

• 一项随机试验计划的中期安全性分析调查了人工智能（AI）在全国乳腺癌筛查项目中的应用，该分析强调了AI在提高乳腺X线筛查准确率和效率方面的潜力。

• 对由超80,000名瑞典女性组成队列的中期研究结果表明，与两名乳腺放射科医生对乳腺X线筛查进行的常规双人读片相比，AI辅助的筛查多检测出20%的癌症。

• AI的使用没有增加假阳性（乳腺X光检查被错误诊断为异常），并减少了44%的乳腺X线读片工作量。

• 然而，主要结果预计要在数年后才能得出，该结果将确定AI是否会减少至少有两年随访期的10万名女性中的间期癌（在两次筛查之间诊断出的癌症），并最终确定AI在乳腺X线筛查中的应用是否合理。

《柳叶刀-肿瘤学》（The Lancet Oncology）发表一项涉及8万多名瑞典女性的中期安全性分析，这是关于此类研究的首项随机对照试验。研究表明，AI辅助的乳腺X线分析在检测乳腺癌方面的效果不亚于两名乳腺放射科医生的合作，且不会增加假阳性，并使读片工作量几乎减半。

然而，最终试验结果预计数年后才能得出：在对10万名女性进行的为期两年的随访中，使用AI解读乳腺X线片是否会减少间期癌（在两次筛查之间发现的癌症，其预后通常比筛查发现的癌症差），最终确定AI在乳腺X线筛查中的应用是否合理。

“这些令人鼓舞的中期安全性结果应被用于指导新的试验和基于方案的评估，以解决许多国家放射科医生明显短缺的问题。但仅凭这些结果还不足以证实AI已经可以应用于乳腺X线筛查。”研究的通讯作者、瑞典隆德大学（Lund University, Swede）的Dr Kristina Lång称，“我们仍需了解对患者预后的影响，尤其是将放射科医生的专业知识与AI相结合是否有助于检测出传统筛查经常遗漏的间期癌，以及该技术的成本效益。”[1]

通过乳腺X线进行乳腺癌筛查，可以在更早、更易治疗的阶段发现乳腺癌，从而改善预后并降低死亡率。然而，据估计，20%-30%间期癌在前一次乳腺X线筛查中本应发现却被漏诊，而可疑的检查结果常常最后发现为良性。

欧洲指南建议由两名放射科医生对筛查性乳腺X线片进行双人读片，以确保高灵敏度（正确识别患病者）。但许多国家都存在乳腺放射科医生短缺的问题，英国2020年所有闲置职位中有41个（8%）乳腺放射科岗位[2]，瑞典约短缺50名放射科医师，而培养一名能够解读乳腺X线片的放射科医生需要十多年的时间。

有人建议将AI作为乳腺X线片的自动第二阅读器，这可能有助于减少工作量并提高筛查准确率。这项技术在回顾性研究中取得了令人鼓舞的成果，研究人员利用AI将检查分诊为单人或双人读片，并为放射科医生提供突出可疑特征的计算机辅助检测（computer-aided detection, CAD）标记，以减少假阴性结果。但目前还缺乏前瞻性随机试验的有力证据。

2021年4月至2022年7月期间，80,033名40-80岁的女性在瑞典西南部的四个地点接受了乳腺X线筛查，按1:1的比例她们被随机分配到AI辅助分析组：由商业化可用的AI辅助乳腺X线读片系统[3]分析乳腺X线片后，由一名或两名放射科医生读片（干预组），或由两名放射科医生读片进行无AI标准分析（对照组）。

这项AI辅助乳腺X线筛查（Mammography Screening with Artificial Intelligence , MASAI）试验的中期分析比较了两组的早期筛查效果（如癌症检测、召回、假阳性）和读片工作量。MASAI试验将继续确定AI辅助的乳腺X线筛查是否会减少间期癌的主要结果。

干预组的临床安全性最低可接受限值定为每1000名接受筛查的女性中癌症检出超过3例。这是基于因为大多数筛查将采用单人读片而非双人读片，癌症检出率可能会下降的前提。目前采用双人读片筛查方案的基线检出率为每1000名接受筛查的女性中癌症检出5例。

在AI辅助分析中，AI系统首先分析乳腺X线图像，并按1到10分的标准预估癌症风险，1代表最低风险，10代表最高风险。如果AI系统预估的风险评分低于10，则由一名放射科医生对图像进一步分析；如果风险评分为10，则由两名放射科医生对图像进行分析。

该系统还提供CAD标记，以帮助放射科医生准确解读乳腺X线图像。根据可疑检查结果召回女性进一步检查。放射科医生拥有召回女性的最终决定权，并被指示召回风险最高的1%病例，但明显的假阳性病例除外。

在0.8%的病例（306/39,996）中，AI未能提供风险评分，这些病例被转至标准分析组（双人读片）。

AI辅助筛查的平均召回率为2.2%（861名女性），无AI的标准双人读片筛查平均召回率为2.0%（817名女性）。这与试验开始前六个月内门诊部的平均召回率2.1%相似，表明癌症检出率并未下降。

在AI辅助筛查召回的女性中，共244名（28%）被查出患有癌症，而在标准筛查召回的女性中，共203 名（25%）被查出患有癌症——因此在AI的辅助下多检测出41例癌症（其中19例为浸润癌，22例为原位癌）。两组的假阳性率均为1.5%。

总体而言，AI辅助筛查的癌症检出率为每1000名接受筛查的女性中检出6例癌症，而不使用AI的标准双人读片筛查的癌症检出率为每1000名接受筛查的女性中检出5例癌症，相当于每1000名接受筛查的女性中多检出1例癌症。

重要的是，与对照组相比，AI辅助组放射科医生的读片量减少了36,886次（46,345 vs. 83,231），使放射科医生的读片工作量减少了44%。

虽然试验中未测量使用AI实际节省的时间，但研究人员计算出，假设一名放射科医生平均每小时读取50张乳腺X线片，那么与对照组双人读取大约40,000张筛查X线片所需时间相比，一名放射科医生在AI辅助下读取研究中的大约40,000张筛查X线片所需时间将减少4-6个月。

“AI目前最大的潜力在于，它可以让放射科医生减轻过多读片的负担。” Lång称，“虽然我们的AI辅助筛查系统至少需要一名放射科医生负责检测，但它有可能使大多数乳腺X线检查不再需要双人读片，从而减轻工作量压力，使放射科医生能够专注于更高级的诊断，同时缩短患者的等待时间。”[1]

尽管研究结果令人鼓舞，但作者也指出了一些局限性，包括分析是在一个中心进行的，且仅限于一种类型的乳腺X线设备和一种AI系统，这可能会限制结果的普遍性。他们还指出，虽然技术因素会影响AI系统的性能和处理过程，但这些因素可能不如放射科医生的经验重要。由于AI辅助系统将是否召回女性的最终决定权交给了放射科医生，因此结果取决于放射科医生的表现。在这项试验中，放射科医生的经验都较为丰富，这可能会限制研究结果对经验较为不足的放射科医生的普遍性。最后，该项实验未收集种族与民族信息。

意大利CPO Piemonte癌症流行病学小组前负责人、筛查部前主任Dr. Nereo Segnan（未参与该研究）在相关评论中写道，乳腺癌AI风险评分在区分高风险和低风险女性方面似乎非常准确，并补充道：“在风险分层筛查方案中，适当调整低风险和高风险组召回标准的潜力巨大。”

然而，他提醒：“在MASAI试验的AI辅助筛查组中，可能存在过度诊断（即系统识别出非癌症）或过度检测出不活跃病变的情况，如相关部分的导管原位癌，因此在解释结果时应小心谨慎，否则这些结果似乎直截了当地支持使用AI......因此，获取有关检测出的病变的生物学信息非常重要。MASAI试验的最终结果有望实现这一点，因为已确诊癌症的特征和间期癌的发生率（而不仅仅是检出率）被视为主要结果。因此，一个重要的研究问题仍然存在：AI在经过适当训练后，是否能够捕捉到相关的生物学特征（疾病的自然史），如肿瘤生长和扩散的能力？”

This study was funded by the Swedish Cancer Society, Confederation of Regional Cancer Centres, and Governmental funding for clinical research. It was conducted by researchers from Lund University, Malmö, Sweden, Unilabs Mammography Unit at Skåne University Hospital, Malmö, Sweden; Cancer Registry of Norway, Oslo, Norway; The Arctic University of Norway, Tromsø, Norway.

参考文献

[1] Quotes direct from authors and cannot be found in text of paper.

[2] Clinical radiology UK workforce census 2020 report (rcr.ac.uk)

[3] The AI Transpara system (version 1.7.0) uses deep learning to identify and interpret mammographic regions suspicious for cancer. It is developed with over 200,000 examinations for training and testing, which were obtained from multiple institutions in more than 10 countries. Annotations of over 10,000 cancers in the database are based on biopsy results and include regions marked in prior mammograms where cancers were visible but not detected by radiologists. Additional information is available at https://screenpoint-medical.com

中文仅供参考，所有内容以英文原文为准。

阅读原文

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

我要举报