11月23日消息,Meta近日推出了WorldGen,这是一种端到端系统,可仅凭单条文本提示词,自动生成可交互、可导航的三维世界,不仅具备高度沉浸感,更支持用户真正步入其中、自由探索。根据Meta旗下Reality Labs的一份最新技术报告,WorldGen能够在大约五分钟内,根据单个文本提示生成可穿越和交互式的3D世界。虽然该技术目前仍处于研究阶段,但WorldGen架构解决了阻碍生成式人工智能在专业工作流程中发挥作用的特定痛点:功能交互性、引擎兼容性和编辑控制。
9月17日,,斯坦福大学教授李飞飞的创业公司World Labs发布了新成果 —— 限量开放的测试预览版空间智能模型Marble。「只需一张图片,就能生成持久存在的3D世界,比以往更宏大、更震撼!」当被问到与谷歌的Genie有什么区别时,李飞飞表示,「我们生成的3D世界是永久存在的,用户可以自由地在其中导航探索,而这一切对你来说完全免费。」
7月27日,2025世界人工智能大会腾讯论坛上,腾讯正式发布混元3D世界模型1.0,并宣布全面开源。这是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型,为游戏开发、VR、数字内容创作等领域带来了全新的可能性。除3D模型外,腾讯混元还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划。目前,混元3D世界模型1.0已全面开源。从秒级生成单个3D资产,到一键打造可漫游的3D世界,腾讯混元正逐步构建完善的3D内容生成生态。
最近有消息曝出,苹果Vision Pro的硬件工程经理,曾经在马斯克Neuralink工作过的Ahmad Abbas加入了Midjourney,正在帮助Midjourney开发硬件产品——一款捕获3D数据的工具。Midjourney创始人David Holz在1月份曾发文表示Midjourney会造个orb(球),很有可能Orb就是此款硬件产品。Holz透露Orb是一款能够生成并管理数以千计的3D空间的设备。Holz曾表示,他对Midjourney不久后能够创造出高质量的3D素材抱有极大的期望。