天涯论坛_华人最大的社区论坛_新天涯社区

查看: 19|回复: 0

Nature点赞!哈佛MIT最新作:AI科学家时代来了

[复制链接]

2万

主题

0

回帖

6万

积分

论坛元老

Rank: 8Rank: 8

积分
64858
发表于 2025-10-21 17:16 | 显示全部楼层 |阅读模式
编辑:LRST
【新智元导读】AI科学家时代正在到来,哈佛MIT最新推出的ToolUniverse,经过一个同一平台,让AI用自然说话操纵600+科学工具,鞭策科研自动化的周全升级,驱逐科学发现新范式提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
科学史的每一次奔腾,常常陪伴着工具的革新提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。随着近期大模子和智能体的飞速成长,这条途径正在通向一种全新的阶段:「AI科学家」提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
在AI赋能科研的前沿,我们正见证一个重要的里程碑:从证实AI智能体「能否」处理特定科学题目,转向思考若何让它「高效、牢靠、范围化」地介入全部研讨进程提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
Nature近期公布的消息剖析, 报道了由哈佛大学Marinka Zitnik和高尚华团队与MIT公布的首款大范围工具开源框架ToolUniverse

消息链接:https://www.nature.com/articles/d41586-025-03246-7
ToolUniverse开放的在线情况让研讨职员可以用自然说话将各类大模子和智能体 毗连到分歧科学范畴常用的工具,为打造AI科学家奠基了根本提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

项目主页:https://aiscientist.tools
论文详解:https://arxiv.org/abs/2509.23426
代码开源:https://github.com/mims-harvard/ToolUniverse


当AI天生模子不再充足
AI科学家为何而来?

传统LLM(大说话模子)的焦点才能是 「文本天生」,但科学研讨需要的远不止于此:
它需要分化复杂题目(如 「若何优化降胆固醇药物」)、计划尝试步调、挪用专业工具(如份子模拟软件)、考证数据公道性,甚至在成果偏离预期时自我批改提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。这类 「推理 + 行动」 的闭环,正是AI从 「模子」 升级为 「科学家」 的关键提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
AI智能体的冲破在于将 LLM 与三大机制深度耦合:
计划才能:将 「发现新药物」 拆解为 「靶点识别→化合物挑选→性质优化→专利考证」 等可履行步调;
记忆系统:追踪中心成果(如 「某化合物对肝构造的渗透率」),避免反复计较或逻辑断裂;
工具挪用:毗连内部数据库、模拟器、分析软件,填补 LLM 本身在专业计较(如份子连系能猜测)上的短板提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
但科学研讨的特别性给 AI智能体 其提出了更高要求:分歧学科(生物、化学、物理)的工具格式分歧一、数据需可复现、尝试流程需松散考证提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
若仅依靠通用的工具挪用协议(如MCP,模子高低文协议),没法处理 「若何让AI了解质谱数据格式」「若何调和份子模拟与临床数据库的输出」 等专业题目提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。而这,正是ToolUniverse处理的焦点题目之一提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。


ToolUniverse
科学AI Agent的生态基石

ToolUniverse并非单一工具,而是一套 「毗连 LLM 与科学工具」 的标准化生态(图 1)提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
它的焦点方针是:让任何LLM都能经过同一接口,挪用600 +科学工具,完成从 「提出假定」 到 「考证结论」 的全流程研讨提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

图1:ToolUniverse 是一个用于打造AI科学家的生态系统提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。通用型大说话模子(LLM)、推理模子与智能体可毗连ToolUniverse供给的600余种科学工具,实现科研工作流自动化提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。


同一科学工具的「HTTP」
处理三大痛点

就像HTTP协议同一了互联网通讯,ToolUniverse为AI科学家界说了专属的 「科学工具交互标准」(图 2),既可以无缝集本钱地摆设的开源工具,也能平安、标准地毗连强大的闭源模子与API办事,处理了MCP协议在科研场景中的三大痛点:

图2: ToolUniverse经过同一协议毗连机械进修模子、智能体、科学软件工具、数据库与API提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。它引入了标准化的工具标准框架,使说话模子可以分歧地发现、挪用并剖析各类工具提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。类似于HTTP在互联网通讯中建立标准的方式,ToolUniverse 协议经过两项焦点操纵:Find Tool(查找工具) 与Call Tool(挪用工具), 界说了AI科学家若何请求工具并接收成果提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
工具发现难:经过「Tool Finder」组件,AI可连系关键词搜索、向量嵌入检索、LLM推理,从600 +工具中精准婚配需求(如 「需要猜测化合物肝毒性」 时,自动定位ADMET-AI工具);挪用不标准:「Tool Caller」组件会先考证输入(如份子结构格式能否合适 SMILES 标准),再履行工具,最初将输出转化为结构化数据(如 「连系能 - 8.2 kcal/mol」 而非混乱文本);推理难闭环:新增 「推理控制层」,让AI能了解工具输出的科学意义(如 「该化合物脑渗透率高→能够激发中枢副感化」),而非仅机械挪用提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
这类标准化设想,让AI从 「会用工具」 升级为 「会用科学工具处理题目」提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。


四大焦点组件
支持AI科学家的完整生命周期
ToolUniverse 经过四大组件(图 3),覆盖了AI科学家从 「工具获得」 到 「 workflow 优化」 的全流程需求,真正实现 「可编程的科学合作」提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

图3: ToolUniverse 供给了六项关键才能,支持AI科学家完整的生命周期:查找工具、挪用工具、增加新工具、将工具串联为工作流、从自然说话天生新工具,以及优化工具标准以提升可用性提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。


Tool Manager:工具的 「注册与治理中心」

它处理了 「若何将新工具接入生态」 的题目:
当地工具(照尝试室自研的数据分析剧本)只需提交 「功用描写 + 参数格式 + 输出示例」,即可被自动归入同一 schema;
远程工具(如云端份子模拟平台)经过 MCP 协议接入,无需表露内部代码,兼顾平安性与兼容性;
自动考证工具有用性(如 「输入毛病份子结构时能否返回提醒」),确保AI挪用时的牢靠性提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

Tool Composer:科学 workflow 的 「搭建者」

科学研讨很少依靠单一工具,比如 「药物挑选」 需要串联 「靶点数据库→化合物库→份子对接工具→毒性猜测工具」提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。Tool Composer 的感化就是:
界说工具间的数据流(如 「份子对接工具的输出结构,间接作为毒性猜测工具的输入」);
支持条件逻辑(如 「若毒性猜测超标,则返回上一步重新挑选化合物」);
天生可复现的 workflow 剧本,方便人类科学家追溯或点窜提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
经过智能系统统,实现工具间挪用关系的自动构建与优化提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

Tool Discover:工具的 「自动天生器」

当现有工具没法满足需求(如 「需要一种新的基因表达数据可视化工具」),AI 可经过自然说话描写需求,Tool Discover 会:
将文本描写转化为结构化工具规格(如 「输入:CSV 格式表达矩阵;输出:热图 + 火山图」);
自动天生代码、测试用例,经过 「预期行为 vs 现实输出」 的反应循环迭代优化;
无需野生编码,让工具库随科研需求静态扩大提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

Tool Optimizer:工具的 「质量保护者」

科学研讨夸大可复现性,Tool Optimizer 经过三大行动保障工具稳定性:
定期天生测试用例(如 「用已知活性的化合物考证份子对接工具的正确性」);
分析工具输出与规格的误差(如 「某工具猜测的连系能与尝试值误差忽然增大」);
自动更新工具文档或参数设备,确保AI挪用时的分歧性提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。


跨模子兼容
让每类LLM都能成为科学助手

分歧科研场景对LLM的需求差别极大:尝试室当地分析能够需要轻量开源模子(如 Llama 3),而复杂 hypothesis 推理能够依靠云端大模子(如 Claude 3),生物医药研讨还需专业模子(如 TxAgent)提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
ToolUniverse的兼容性设想打破了 「模子绑定」 范围(图 4):将工具挪用转化为 「标准化函数挪用」,无需点窜 LLM 的权重或Tokenizer——只需通太轻量级包装器,向模子传递 「工具列表 + 参数格式」,模子输出即可被剖析为工具挪用指令提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
这类设想的代价在于:
科研团队可按照本钱、隐私需求挑选模子,无需担忧 「换模子就要重写工具挪用逻辑」;
能在不异尝试条件下对照分歧模子的性能(如 「用Gemini-CLI vs Claude 3做药物挑选,哪个正确率更高」);
支持专业模子与通用工具的连系(如 「让TxAgent挪用 ChEMBL 数据库,分析药物 - 靶点相互感化」)提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

图4: ToolUniverse 为构建分歧范例的AI科学家供给了简洁而高效的协议:既可用于基于通用大说话模子(如左图的 Claude),也可用于具有更强推理与控制才能的智能系统统(如右图的 Gemini-CLI),以及专注于生物医学研讨的AI智能体(如 TxAgent)提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。



案例实证
AI科学家若何优化降胆固醇药物

理论架构需要理论考证提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。我们以 「寻觅更平安的降胆固醇药物」 为例,看看 ToolUniverse 构建的AI科学家(基于 Gemini-CLI agent)若何完玉成流程研讨(图 5)提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

图5:展现了一个基于 ToolUniverse 构建并利用于药物发现的AI科学家实例提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。该系统与 Gemini-CLI 智能体相连,可以识别生物学靶点、挑选并优化候选药物、评价份子性质,并操纵计较工具考证成果提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。全部工作流程展现了AI科学家若何在药物研发的各个阶段停止推理、整合多源证据,并在需要时融入人类反应提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
步调1:靶点识别 —— 锁定 「关键卵白」
AI首先挪用 「文献挖掘工具」 和 「药物 - 靶点数据库」,经过度析 thousands of 研讨论文与临床数据,得出结论:HMG-CoA 复原酶是胆固醇分解的关键酶,且该酶在肝脏外的过度抑制会激发肌肉疼痛等副感化提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。这一步完全复刻了人类科学家的 「靶点发现」 逻辑,但效力提升 10 倍以上提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
步调2:肇端化合物挑选 —— 从现有药物动手
AI经过ToolUniverse查询 「已上市降胆固醇药物库」,挑选出以 HMG-CoA 复原酶为靶点的药物,终极挑选 「洛伐他汀(lovastatin)」 作为肇端化合物 —— 来由是 「临床考证充实,但肝外构造渗透率高,存在副感化风险」提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
步调3:化合物优化 —— 提升平安性与有用性
AI挪用三大工具合作:
ChEMBL 数据库:获得洛伐他汀的100 +结构类似物;
Boltz-2 工具:猜测每个类似物与 HMG-CoA 复原酶的连系能(数值越低,连系越强);
ADMET-AI工具:猜测类似物的肝渗透率、脑渗透率、代谢稳定性提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
经过综合排序,AI挑选出两个候选:
普伐他汀(pravastatin):已知药物,肝外渗透率低,副感化更少(考证了AI的牢靠性);
CHEMBL2347006/CHEMBL3970138:新化合物,连系能比洛伐他汀高 30%,脑渗透率下降 50%,生物操纵度提升 25%提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
步调4:专利与考证 —— 躲避法令风险
最初,AI挪用 「专利检索工具」,发现新化合物已被注册用于血汗管疾病治疗,虽没法间接开辟,但为后续结构修饰供给了偏向提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
全部进程中,AI不但完成了 「挪用工具」 的行动,更表现了科学推理才能:它能诠释 「为何挑选该靶点」「为何淘汰某化合物」,甚至能按照副感化风险调剂优化偏向 —— 这正是 「AI科学家」 与普通工具挪用的本质区分提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。


从用到建
当「利用者」成为「共创者」

一个健康的生态系统,其生命力不但来历于利用,更来历于缔造与进献提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
ToolUniverse内置了Tool Discover和Tool Optimizer等焦点组件提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。前者答利用户经过自然说话描写,自动化天生新工具的标准与代码框架;后者能经过量轮测试与反应,延续优化现有工具的说明与易用性提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
这一机制奇妙地将用户从纯洁的「消耗者」改变成潜伏的「共建者」,激励社区聪明反哺生态,构成一个自我完善、延续发展的良性循环提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

ToolUniverse的终极愿景,是赋能各个科学范畴的专家,而不但仅是AI专家提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。当生物学家、化学家、药物研发职员可以基于一个稳定、丰富的工具生态,轻松定制合适其怪异研讨需求的「AI科研伙伴」时,也许将迎来一个真正AI帮助科研的全新时代提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
AI科学家不但能挪用数据库、模拟器,还能经过标准化协议控制尝试室自动化装备(如液体处置机械人、质谱仪),实现 「提出假定→设想尝试→自动履行→分析成果」 的全流程闭环提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
当AI能真正了解科学题目、自立调和工具、与人类配合推动认知鸿沟时,我们也许正站在 「科学发现新范式」 的起点提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

ToolUniverse开辟团队
参考材料:
https://arxiv.org/abs/2509.23426

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|天涯论坛_华人最大的社区论坛_新天涯社区  

GMT+8, 2025-11-6 23:50 , Processed in 1.558320 second(s), 26 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表