天涯论坛_华人最大的社区论坛_新天涯社区

查看: 22|回复: 0

麻省理工新技术曝光,大型模子“自己教自己”,性能不降反升狂飙

[复制链接]

2万

主题

0

回帖

6万

积分

论坛元老

Rank: 8Rank: 8

积分
65118
发表于 2025-10-18 01:17 | 显示全部楼层 |阅读模式
当我们习惯了 AI 在牢固框架内响应指令,有一天它能像人类一样自动发现不敷、自立提升才能?
麻省理工学院的研讨者近期曝光的 SEAL 技术,正悄悄改写 AI 成长的法则,这项被业内热议的冲破性技术,让大模子初次摆脱对内部数据的依靠,开启 “自己教自己” 的全新形式提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
它究竟用了什么方式打破传统 AI 的性能天花板,又将为野生智能范畴带来怎样的变化?

从 “工具” 到 “生命体”:SEAL 重构 AI 认知鸿沟久长以来,传统大说话模子始终受限于 “摆设即固化” 的窘境提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
一旦完成练习上线,其常识范围与才能水平便根基定格,后续改良必须依靠开辟者重新收集数据、启动烦琐的全量练习提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
不但花费大量本钱,还难以跟上信息更新的速度,而 MIT 研发的 SEAL 技术,以 “自顺应大说话模子” 的定位,完全打破了这一桎梏提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
它的焦点创新在于赋予 AI “自我编辑” 的才能提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
模子能自立诊断本身在使命中的短板,比如识别出在逻辑推理类题目上的正确率偏低提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
接着自动天生针对性的分解练习数据,就像门生针对亏弱学科自立刷题;最初经过数据完成参数微调,实现才能的精准提升提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
这类自立进化形式,让 SEAL 在现实场景中展现出惊人代价提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
在金融里它能逐日分析市场报告与消息,自动天生问答对进修新金融术语,连结常识时效性提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。甚至在教育上它可按照门生互动反应,天生新讲授材料优化教导战略提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
更具倾覆性的是,SEAL 鞭策听类对 AI 的认知发生底子改变提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
从将其视为 “被动履行指令的工具”,升级为 “具有自立进修才能、可不竭重塑本身的智能生命体雏形”提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
这类改变背后,是 AI 成长逻辑的迭代,SEAL 不再依靠大范围预练习的 “蛮力”,而是凭仗精巧架构实现高效增加,为野生智能翻开了全新的成长空间提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

SEAL 自立进修的 “动力引擎”SEAL 之所以能实现 “自己教自己”,关键在于其背后两套焦点技术构建的 “动力引擎”,让自立进修从概念落地为高效运转的现实提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
第一套焦点技术是创新的双循环架构,它构建了 “战略天生 - 履行反应 - 优化迭代” 的完整闭环提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
外循环由 “战略模子” 主导,会天生包括进修率、练习轮数、损失函数战略等细节的自然说话 “self-edit 指令”,明白模子的进修偏向与履行标准提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
内循环则承当 “履行者” 脚色,根据指令天生推理句、问答对、信息重述等多样化分解数据,再以这些数据为根本完成监视微调提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
更重要的是,内循环的性能评价成果会间接作为嘉奖信号,反哺外循环优化下一轮指令天生战略,让模子的进修偏向越来越精准提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
第二套焦点技术是 ReSTEM 强化进修算法,它如同 “质量过滤器”,确保自立进修不偏离有用轨道提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
ReSTEM 采用 “行为克隆 + 过滤采样” 的思绪,不间接对嘉奖信号停止梯度回传提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
而是天赋生多个自我编辑候选计划,逐一停止微调与性能测试,仅保存能真正提升模子才能的有用计划,再以这些计划为样本优化进修战略提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
这类方式避免了自觉练习致使的性能退化,相比 PPO 等传统战略梯度算法,更适配大模子的天生行为进修,成为 SEAL 性能 “狂飙” 的关键支持提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
此外,LoRA 轻量级微调技术进一步下降了 “动力引擎” 的运转本钱提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
它不像传统微调那样 “重写整本书”,而是如同 “在册页边沿做邃密批注”提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
无需修改模子全数参数,仅经过注入少许适配层完成更新,大幅削减计较资本消耗,让 SEAL 的快速尝试与低本钱落地成为能够提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

SEAL 用数据革新大模子性能上限任何技术的冲破性,终极都需要在威望测试中用数据考证,SEAL 在常识整合与少样本进修两大焦点场景的表示,完全打破了传统大模子的性能桎梏提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
在常识整合使命中,研讨团队以 Qwen2.5-7B 模子为根本,采用斯坦福大学 SQuAD 数据集展开测试 提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
该数据集包括 10 万余个维基百科问答对,是评价机械阅读了解才能的 “黄金标准”提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
测试早期,原始模子在单段落场景下的正确率仅为 32.7%,即即是采用原文微调的优化方式,正确率也仅提升至 33.5%提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
而 SEAL 技术介入后,经过自立天生定向练习数据并完成微调,正确率间接跃升至 47.0%,不但大幅超越传统方式,更跨越了用 GPT-4.1 天生分解数据的 46.3%提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
更值得关注的是,在 200 段落的大范围场景及包括 2067 段落的完整 SQuAD 考证集合,SEAL 仍连结明显上风,充实证实其在复杂数据场景下的泛化才能提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
在更切近现实需求的少样本进修场景中,SEAL 的表示一样冷艳提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
研讨团队选用 LLaMA-3.2-1B-Instruct 模子,针对 ARC-AGI 使命子集展开测试 —— 该使命要求模子在仅获得少许示例的情况下完成科学推理提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
成果显现,传统无顺应机制的模子成功率为 0%,即使采用无强化进修的自我编辑方式,成功率也仅为 20%;
而 SEAL 凭仗双循环与 ReSTEM 算法的协同感化,将成功率一举提升至 72.5%提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
这些数据不但印证了 SEAL 的技术有用性,更凸显其在快速顺应新使命、新范畴时的怪异上风,为静态场景下的 AI 利用供给了性能保障提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

SEAL 的产业化之路任重道远SEAL 技术虽展现出倾覆 AI 行业的潜力,但从尝试室走向大范围利用,仍需跨越技术、资本与架构三大障碍提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
“灾难性忘记” 是最焦点的困难 ,当模子在进修新常识时,能够会覆盖已把握的旧常识,如同人类在进修新技术时忘记旧本事提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
不外研讨团队发现,SEAL 内置的强化进修机制,比传统监视微调更能减缓这一题目提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
未来经过将嘉奖函数进修与 SEAL 深度连系,有望进一步平衡 “学新” 与 “保旧” 的关系提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
SEAL 单次自我编辑需完成指令天生、微调履行、性能评价等流程,耗时长达 30-45 秒,远超凡规 AI 使命的处置效力提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
加上双循环架构需要调和两个嵌套的优化进程,对计较资本的稳定性与算力储备提出极高要求,这为技术的快速迭代与范围化测试设下门坎提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
当前支流 AI 办事架构均为 “冷冻权重” 模子设想,而 SEAL 需要在推理进程中静态更新权重,这意味着从云办事平台到边沿计较装备,全部技术栈都需重构提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
虽然应战重重,但 SEAL 的开源特征已激发 AI 社区热烈反应,其在自我预练习、智能代理系统等范畴的利用远景,或将成为冲破当前 AI 数据瓶颈的关键途径提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

结语MIT 的 SEAL 技术,以 “自我编辑” 才能打破传统 AI 的固化范围,用双循环与 ReSTEM 算法构建自立进修引擎,在实战中革新性能上限提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
它不但鞭策 AI 从 “工具” 向 “智能生命体” 改变,更开启了 AI “巧力” 成长的新纪元提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
虽然面临忘记、算力、架构等应战,但 SEAL 的出现,已然为野生智能自立进化指明偏向,未来随着技术迭代,或将重塑全部 AI 行业的成长格式提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|天涯论坛_华人最大的社区论坛_新天涯社区  

GMT+8, 2025-11-7 18:12 , Processed in 1.882600 second(s), 26 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表