天涯论坛_华人最大的社区论坛_新天涯社区

查看: 16|回复: 0

超声AI困局被破?“聆音”双分支架构,看病快还准

[复制链接]

2万

主题

0

回帖

6万

积分

论坛元老

Rank: 8Rank: 8

积分
63863
发表于 2025-10-2 19:20 | 显示全部楼层 |阅读模式
2025年9月17号,中国科学院香港创新研讨院的CAIR在香港搞了个大事,开源公布了EchoCare“聆音”超声基座大模子提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。说真话,这模子一亮相就挺炸场,它是用450多万张、覆盖50多小我体器官的超声图训出来的,而且在器官识别、病灶分类这些10来项医学使命里,性能间接冲到了顶提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

原本想光说“聆音”多利害就行,但后来发现,要大白它为啥重要,得先聊聊之前超声AI的窘境,现在我们国家每年超声检查超20亿人次,占了一切医学影象检查的七成以上,从怀孕看胎心到急诊查创伤,再到慢性病随访,哪儿都离不开它提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。可AI想帮上忙,难度真不小提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。分歧厂商的超声机,信号算法纷歧样,就算是同一个器官,拍出来的纹理都能差老远;医生扫查的角度、按探头的气力变一点,同一个病人的图也会差很多提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。老实讲,这就致使传统AI只能针对某一种情况开辟,跟拆零件似的,底子没法大范围落地提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

而且现有的那些医学影象基座模子,比如MedSAM、BioMedCLIP、USFM,在超声范畴实在不太行提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。它们的练习数据大多不到100万张,还只盯着一个部位,更关键的是,它们还用的是自然图像的算法架构,没斟酌超声独有的那些斑点噪声、声影伪影,也没顺着医生“先看地区再找器官”的诊断逻辑来优化提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。如此看来,传统模子卡壳也不是没缘由提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

从数据到架构:“聆音”是怎样打破常规的?“聆音”就没走传统模子的老路,它的根柢从一路头就纷歧样,它用的数据集叫EchoAtlas,是团队从Zenodo、Kaggle这些平台整合了138个高质量数据集搞出来的,覆盖了五大洲20多个国家,足足450多万张图,比现在最大的超声数据集US-45K多了快10倍提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。这数据集里人种也全,黄种人、碧眼儿、黑种人、棕种人都有;剖解结构覆盖了9大地区56个器官;B超、M超、超声造影这些支流模态也都包括了,连飞利浦、西门子、日立的130种装备的数据都有提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。更靠谱的是,团队还搞了四阶段质控,从数据挑选到标注考核,再到穿插考证、剔除异常,一步步把关,数据质量必定没话说提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

“聆音”的架构也透着巧劲,不是那种死板的设想,它用SwinTransformer当图像编码器的主干,还专门优化了留意力机制,这样对于超声里的斑点噪声就利害多了,原本SwinTransformer在医学影象里,边沿特征识别正确率也就68%左右,“聆音”一优化间接提到了82%提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。它还有两个解码器分支,一个负责学构造纹理这些像素级的特征,另一个搞剖解分类,还分了三级,就跟医生先看胸部、再找心脏、最初定位心尖四腔心一样,出格贴合临床逻辑提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。毫无疑问,这样的设想比硬套算法适用多了提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

数据和架构到位了,练习方式也得跟上,“聆音”用了两阶段练习,全局预练习的时辰,搞了个结构化对照自监视进修框架,还连系了图像掩码重建、自顺应困难图块挖掘这些技术,专门盯着诊断的关键细节学提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。到了下流使命微调的时辰,非论是做朋分还是诊断,只需要本来40%到60%的练习量就能适配,收敛速度还快了三成到四成提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。搞不清传统模子为啥要揪着全量数据不放,“聆音”这操纵,对想快速用它的医院来说,简直太省事儿了提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

临床真能用?3000多例考证,10项使命都领先“聆音”不是光在尝试室里利害,它已经在山东大学齐鲁医院、中南大学湘雅医院、香港中文大学医学院做了3000多例临床回溯性考证,比现在最好的SOTA模子,性能均匀高了3%到5%提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。湘雅医院的考证数据里还提到,它在甲状腺结节诊断里,假阳性率比传统模子低了27%,这对病人来说太重要了,能少做很多没需要的检查提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
在剖解朋分这事儿上,“聆音”表示出格突出,甲状腺结节朋分的DSC值能到83.17%,比USFM高很多;血管朋分的mDSC值82.24%,也比USFM高2%,比传统模子SwinUNETR的70.20%强太多;腹部多器官朋分,它也是今朝性能最好的提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

看病最关键的还是诊断准不准,在甲状腺结节良恶性辨别上,“聆音”的AUC值有86.48%,F1分数87.45%,假阳性率才8.3%提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。出格是小于1厘米的恶性结节,它能检出82.1%,比现有模子高了11.3%,这样就能少做30%没需要的活检,病人也少遭罪提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。乳腺BI-RADS分级的正确率70.36%,比USFM高3.09%;肝脏病变诊断正确率87.12%,肝癌的敏感性90.3%、特同性88.7%,还能给医生展现判定根据,不是光给个成果就完事儿提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
定量分析上,“聆音”也不含糊,测胎儿心胸比,它的定位正确率94.42%,比USFM高2.78%,误差小于5%的病例占了89.2%,关键是快,本来医生得测5分钟,现在2秒就好,对筛查天赋性心脏病帮助太大了提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。在CAMUS数据集上算左心室射血分数,它的MAE比USFM低19%,今后指导心衰治疗说不定能派上大用处提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

下层医院的超声图质量经常不高,“聆音”在这方面也能打,增强后的图像目标NIQE6.35、BRISQUE17.62,都比USFM和EnlightenGAN好提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。而且它分析一张图不到0.5秒,能出朋分掩码、热力图这些医生看得懂的成果,还能帮手写报告,BLEU-4值有78.47,医生改改就能用提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。标注数据也不用给全,60%的数据就能到达传统模子100%数据的结果,血管朋分更省,40%的数据就能实现80%的性能上限提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
“聆音”不但自己利害,还开源了数据集和代码,现在超声AI范畴也就12%的模子开源,它一出来就有20多家机构申请用它的材料,这就能打破数据壁垒和技术把持,让更多人介入到超声AI的研讨里提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。不外它也不是完善的,比如多模态信息融合还不够,没法处置超声视频这类静态数据,以后还要在10家医院做多中心实验,进一步考证结果提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

总的来说,“聆音”作为第一个专门针对超声临床场景的基座大模子,确切给超声AI指了条新门路,靠大范围数据、定制化架构和多场景考证,既能进步正确率,又能真正帮到医生提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。今后如果多模态融合、常识驱动进修这些技术再跟上,它说不定就能从纯真的图像分析工具,酿成医生全流程的决议伙伴提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。到时辰下层医疗、远程诊断这些场景都能受益,医疗资本也能更普惠提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。说真话,这才是AI该干的事儿提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|天涯论坛_华人最大的社区论坛_新天涯社区  

GMT+8, 2025-11-5 13:38 , Processed in 2.504988 second(s), 26 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表