天涯论坛_华人最大的社区论坛_新天涯社区

查看: 7|回复: 0

一张图天生 3D 模子,字节此次太会玩了!

[复制链接]

2万

主题

0

回帖

6万

积分

论坛元老

Rank: 8Rank: 8

积分
63480
发表于 2025-11-3 17:34 | 显示全部楼层 |阅读模式
比来,字节跳动的 Seed 团队放了个大招:Seed3D 1.0 正式上线提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
一句话总结:只需一张图,AI 就能天生一个高质量、可间接用于仿真情况的 3D 模子提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

别看这听起来像个“AI 捏泥巴”的小功用,但在具身智能(Embodied AI)和天下模拟器(World Simulator)的成长线路里,这一步,实在挺关键提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
曩昔几年,3D 天生一向卡在一个老困难上:“传神”和“可交互”,不能同时拿满分提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
基于视频的天生模子,画面精美、细节丰富,但物理信息不稳定;传统图形学模拟器逻辑松散,却受限于素材库,天生速度慢、内容单一提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

Seed3D 1.0 想做的,就是把这两者连系起来,让 AI 不止能“看见天下”,还能“构建天下”提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
技术上,Seed3D 走的是 Diffusion Transformer 架构提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
分散模子负责天生的“设想力”,Transformer 则供给了解和结构控制,两者连系,让模子既能捕捉多少的正确性,也能保持材质和纹理的实在感提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
最酷的是它的“端到端天生”:输入一张图,输出一个完整的 3D 模子,多少、纹理、PBR 材质一步到位,不用手动修修补补,AI 自己搞定一切提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
而阿谁关键的 “PBR”(基于物理的衬着),就像让模子自带“现实感”,金属反光、皮革漫反射、织物粗糙度等,都能在分歧光照下自然显现提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
换句话说,它天生的模子不可是“看起来像”,而是能被间接用在物理仿真或交互练习里提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

为了让模子“懂”多少与材质,Seed 团队搭了套完整的数据管线:同一数据格式 → 去重与姿势校准 → 多少重构与多视角衬着 → 天生标准化练习数据提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
这套流程保证了模子能进修到多少的完整性和材质的物理分歧性提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

加上散布式练习架构,Seed3D 能处置海量 3D 数据,还能随时扩大提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
在尝试成果上,它一样表示亮眼:





多少天生方面,1.5B 参数的 Seed3D,性能超越了业界 3B 模子(如 Hunyuan3D-2.1)提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
纹理和材质天生上,在纹理清楚度、复杂概况(笔墨、标记、金属等)连结性上更稳定提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。



团队还请了 14 位评价员打分,从视觉清楚度到材质纹理,Seed3D 在六个维度都拿了高分提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
一句话: SOTA(state-of-the-art)级表示提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

Seed3D 的另一个亮点,是它天生的模子可以间接集成到仿真引擎中利用提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
比如,模子可以一键导入 NVIDIA Isaac Sim 等情况,用于机械人练习提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。系统还会用视觉说话模子(VLM)自动预算物体尺寸,确保物理比例实在提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
导入后,物理引擎会自动补齐碰撞网格、磨擦系数等参数,机械人可间接停止抓取、移动、交互等尝试,实时获得动力学反应提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

这对具身智能来说,是实打实的好消息提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
更欣喜的是,Seed3D 不止能天生单个物体,它还能造场景提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
AI 会先识别图像中的工具与空间关系,再为每个工具天生自力模子,最初拼分解完整三维空间提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
也就是说,未来只需上传一张街景照,AI 就能帮你生出一个可周游的 3D 天下提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
这间接给“天下模拟器”供给了养料:丰富的 3D 情况、实在物理属性、多视角交互数据提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
具身智能的下一步练习素材,多数就靠这类系统供给提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。

固然,Seed 团队也很实在,没吹太满提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
他们提到今朝还有几个待优化偏向:极端光照下的泛化才能、复杂结构的稳定性,以及多物体关系的持久分歧性提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
未来版本,他们计划引入多模态大说话模子(MLLM),让系统更懂语义、更会跨模态控制,提升天生质量与鲁棒性提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
那时辰,AI 能够不但“了解图像”,还会“了解场景”:
晓得哪是“客厅的沙发”,哪是“路边的路灯”,构建出结构更公道、交互性更强的虚拟天下提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
Seed3D 1.0 今朝已在火山引擎的方舟体验中心(Ark Console)开放 API,很多网友已经上手体验,也给出了反应:

有人希望能上传多张分歧角度的图片,让模子“看得更全”;也有人发起增加个网格显现功用,好让大师一眼看出建模细节提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
整体来看,口碑不错,但用户已经起头催版本更新了提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
此次 Seed3D 的公布,不但补上了字节在 3D 天生偏向上的关键一环,也意味着国内在“AI 天下构建”层面的技术力正在加速成熟提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
当 2D 天生已成常态,3D 的时代正在到来:从图片到物体,从物体到天下,AI 正在学着自己造一个宇宙提出申请的零售商必须在新米大量上市的8月底前完成储备米销售。
参考材料:
字节跳动Seed、火山引擎、微博
编辑:不吃麦芽糖

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|天涯论坛_华人最大的社区论坛_新天涯社区  

GMT+8, 2025-11-4 17:50 , Processed in 2.164386 second(s), 26 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表