谷歌化身AI抗癌先锋!基因神器覆盖主流测序,攻克癌症识别难题!
就在刚刚,谷歌又带来一项科学突破!谷歌与加州大学圣克鲁兹分校的科学家们联合发布了DeepSomatic,成果发表在Nature Biotechnology上。
这款模型使用卷积神经网络来分析测序数据,帮助检测肿瘤细胞中的基因突变。
DeepSomatic的性能优于当前所有主流短读长测序技术,可以更快地识别致癌突变,为更精准、个性化的癌症疗法铺平道路。
在儿童白血病的应用中,DeepSomatic成功发现了10个此前未被报告的新突变,这些可能成为潜在治疗靶点。
谷歌副总裁Yossi Matias认为这项成果是「体细胞变异检测的里程碑」。
目前谷歌已将该模型及其训练数据开源,加速学术界和工业界的研究。
工具:
https://github.com/google/deepsomatic
数据:
https://github.com/CASTLE-Panel/castle
而就在一天前,谷歌才报告了生物大模型C2S-Scale,提出了一项癌症新假设,并通过了实验验证!
在此之前,谷歌还发布了一系列AI在癌症研究领域的成果,包括帮助乳腺癌筛查的X光检查、肺癌筛查的CT扫描以及妇科癌症等。
网友对此评价道,「谷歌在AI抗癌领域再次取得重大突破......到2030年,人工智能将解决癌症问题」
我们正在快速迈进一个AI诊断并治愈癌症的世界。
利用AI,精准识别基因突变
癌症本质上是一种遗传性疾病,其根源在于细胞分裂调控机制中的基因变异。
这些变异大部分不是先天的,而是在个体出生后逐渐积累的——这被称为体细胞突变。
癌症治疗的关键一步是识别肿瘤的体细胞突变。然而,从复杂的测序数据中区分真实的癌症相关突变与测序误差,极具挑战性。
为此,谷歌联合加州大学圣克鲁兹分校、美国国家癌症研究所等,共同开发出DeepSomatic,专门用于从高通量测序数据中识别癌症相关的体细胞突变。
DeepSomatic基于卷积神经网络(CNN),将测序数据转化为图像,AI通过“看”这些图像,学习识别真实突变的模式。
这种“图像化+深度学习”的方法,显著提升了对低频、复杂变异的识别能力。
为了训练和评估DeepSomatic,研究团队创建了一个前所未有的高质量基准数据集——癌症标准长读评估数据集(CASTLE)
CASTLE包含6个癌症细胞样本(4个乳腺癌+2个肺癌),每个样本都使用三种测序技术(illumina、PacBio、Oxford Nanopore)进行全基因组测序。
来自接近33万个体细胞变异的测试结果表明,适用于三个主要测序平台开发的DeepSomatic比现有方法表现更好,以更高的准确性识别出更多的肿瘤变异。
尤其是,在识别涉及遗传密码插入和删除(InDel标记)的癌症突变方面,该模型展现出强大优势。
在PacBio测序数据中,现有方法得分不到50%,而DeepSomatic得分超过80%。
此外,DeepSomatic还成功应用于更具挑战性的场景:
FFPE保存样本:这类样本因DNA降解严重而难以分析,DeepSomatic仍能高效识别突变。
全外显子测序(WES):聚焦编码区,成本更低,广泛用于临床,DeepSomatic在此场景下也表现优异。
多癌症适用,AI揭示儿童白血病新发现
尽管DeepSomatic主要是由乳腺癌和肺癌数据训练而成,但其也可以应用于其他肿瘤领域,展现出强大的跨癌症泛化能力。
团队分析了胶质母细胞瘤的单个样本,尽管这种脑癌突变数量少,DeepSomatic仍能识别关键驱动突变。
研究人员还与堪萨斯城儿童慈悲医院合作,使用DeepSomatic 分析了8个已测序的小儿白血病样本。
小儿白血病是最常见的儿童癌症之一,肿瘤细胞存在于血液中。因此很难从患者中分离出完全“正常”的非癌细胞作为对照样本。
尽管存在这一挑战,DeepSomatic准确检出已知的致病突变,验证了模型的可靠性。
更重要的是,DeepSomatic还成功发现了10个此前从未报告的新突变,这些有可能成为潜在的治疗靶点。
下一步,谷歌希望更多研究机构和临床医生能够使用这个工具。
检测已知的癌症变异,有助于指导化疗、免疫疗法或靶向药物的选择。
以及识别新的癌症突变,则将为全新的潜在疗法带来可能。
页:
[1]