研究：AI 医疗诊断平均准确率 52.1%，与非专家医生相当-电闪软件站

本站 4 月 21 日消息，大阪都会大学医学研究生院 Hirotaka Takita 博士和 Daiju Ueda 副教授领导的研究小组近期发布一项系统性回顾和荟萃分析，深入评估了生成式人工智能（AI）在诊断医疗状况方面的表现，并将其与医生进行了对比。

研究团队筛选了总计 18371 项研究，最终确定 83 项进行详细分析。这些研究涉及多种生成式 AI 模型，包括 GPT-4、Llama3 70B、Gemini 1.5 Pro 和 Claude 3 Sonnet 等，覆盖了多个医疗领域。其中，GPT-4 是研究最多的模型。结果显示，这些 AI 模型的平均诊断准确率为 52.1%（95% 置信区间：47.0% - 57.1%）。部分模型的诊断准确率与非专家医生相当，两者之间没有显著统计差异（准确率差异：0.6% [95% 置信区间：-14.5% 至 15.7%]，p=0.93）。然而，专家医生的表现仍优于 AI，其准确率差距为 15.8%（95% 置信区间：4.4% - 27.1%，p=0.007）。尽管如此，随着技术的不断进步，这一差距可能会逐渐缩小。

研究还发现，AI 在大多数医学专科的表现较为一致，但有两个例外：皮肤科和泌尿科。在皮肤科，AI 的表现更为出色，这可能是因为该领域涉及模式识别，而这是 AI 的强项。但皮肤科同样需要复杂的推理和针对患者的决策，因此 AI 的优势并不能完全反映其在该领域的实际应用价值。对于泌尿科，研究结果仅基于一项大型研究，因此其结论的普适性受到一定限制。

“这项研究表明，生成式 AI 的诊断能力与非专家医生相当。它可以用于医学教育，支持非专家医生，并在医疗资源有限的地区协助诊断。”Hirotaka Takita 博士表示，“未来的研究需要在更复杂的临床场景中进行评估，使用实际病历进行性能评估，提高 AI 决策的透明度，并在不同患者群体中进行验证，以进一步证实 AI 的能力。”

本站注意到，除了诊断领域，该研究还强调了生成式 AI 在医学教育中的潜力。研究人员指出：“当前生成式 AI 模型在非专家环境下的表现与医生相当，这为将 AI 整合到医学培训中提供了机会。” AI 可以用于模拟真实病例，帮助医学生和受训者学习和评估他们的技能。

然而，研究也对这些模型的透明度和偏见提出了担忧。许多 AI 系统并未公开其训练数据的详细信息，这引发了关于其结果是否适用于所有人群的疑问。研究人员强调，“透明度确保了对模型知识、背景和局限性的理解”，并强调需要开发清晰、符合伦理且经过充分验证的 AI 应用。

目前，尽管生成式 AI 具有巨大潜力，但在涉及详细患者信息的复杂病例中仍面临挑战。医生们是否需要担心失去工作？目前尚难定论，但在诊断领域，这种情况是有可能发生的。

研究：AI 医疗诊断平均准确率 52.1%，与非专家医生相当

1

滴滴宣布投入 20 亿元稳就业促消费，积极应对外部挑战

滴滴宣布投入 20 亿元稳就业促消费，积极应对外部挑战
2025/04/18

2

《半条命3》玩法技术剧情大揭秘，戈登·弗里曼故事将迎终章？

《半条命3》玩法技术剧情大揭秘，戈登·弗里曼故事将迎终章？
2025/04/20

3

快手网页版登录入口

快手网页版登录入口
2025/04/15

5

在线设计平台 Canva 新增多项 AI 技能：图片生成、互动编程、电子表格等

在线设计平台 Canva 新增多项 AI 技能：图片生成、互动编程、电子表格等
2025/04/15

6

《中土世界》复仇女神系统：创意源于防二手，未来路在何方？

《中土世界》复仇女神系统：创意源于防二手，未来路在何方？
2025/04/19

7

老师脱让学生摸流片游戏：这类校园游戏对孩子教育的影响你了解吗？社会对此有何看法？

老师脱让学生摸流片游戏：这类校园游戏对孩子教育的影响你了解吗？社会对此有何看法？
2025/04/04

8

三星新专利曝光：折叠游戏掌机融合任天堂DS与PS Portal设计

三星新专利曝光：折叠游戏掌机融合任天堂DS与PS Portal设计
2025/04/08

9

《雾境序列》手游宣布将于2025年停运，今日起关闭充值功能

《雾境序列》手游宣布将于2025年停运，今日起关闭充值功能
2025/04/11

10

谷歌迄今最贵 AI 模型：Gemini 2.5 Pro API 定价公布，每百万输入 tokens 1.25 美元起

谷歌迄今最贵 AI 模型：Gemini 2.5 Pro API 定价公布，每百万输入 tokens 1.25 美元起
2025/04/06

滴滴宣布投入 20 亿元稳就业促消费，积极应对外部挑战

戴尔首款 OLED 显示器 S3225QC 国行上市：31.6 英寸 4K 120Hz 面板 + AI 3D 空间音频，6499 元

日产一线与三线车型区别分析：如何根据需求选择适合的车型？

如何通过"18_XXXXXL56HGID"编号了解更多产品信息？你真的懂它吗？

部分 iPhone 用户反馈升级 iOS 18.4 后，遇到 CarPlay 功能异常

小鸡宝宝考考你今天的答案是什么蚂蚁庄园小课堂答案汇总2025

ysl水蜜桃86满十八与88的色差与质地差异解析：如何根据肤色和场合选择？

《老公请部长家里吃饭》日剧：家庭与职场如何找到平衡？

雷神AI智能眼镜来袭：内置语音助手+拍照，首发仅1799元起！

如何选择9.1免费网站NBA平台：最佳观赛体验的全面指南