分享
Scan me 分享到微信

AI星球 | 谷歌发布新世界模型 实时生成四维地图

AI 视觉迈入 “四维全感知” 时代 ,让机器第一次真正 “看懂” 了这个流动的、动态的世界。

封面、内文图源:AI生成

撰文丨泰伯网综合

泰伯网讯,近日,谷歌DeepMind 正式发布D4RT(Dynamic4D Reconstruction and Tracking)—— 一款融合三维空间与时间维度的统一 AI 模型。它的横空出世,直接宣告 AI 视觉迈入 “四维全感知” 时代 ,让机器第一次真正 “看懂” 了这个流动的、动态的世界。

一、告别 “拼图式” 视觉,D4RT 重构 AI 看世界的方式

过去,让 AI 从一段 2D 视频里还原立体动态的现实世界,就像在玩一场复杂的拼图游戏。

工程师需要堆砌一堆模型:有的负责计算物体深度,有的负责追踪动作轨迹,有的负责校准相机视角。这种 “打补丁” 式的技术路线,不仅让 AI 系统臃肿迟缓,更让它对世界的认知支离破碎 —— 就像一个人用无数块碎片拼凑风景,却永远看不到全貌。

而 D4RT 的出现,直接颠覆了这套传统玩法。

它采用了一种极简的 “查询式” 架构 ,把所有复杂任务浓缩成一个核心问题:“视频里的某个像素,在某个特定时间点,从某个特定镜头看过去,到底位于三维空间的哪个坐标?”

简单来说,D4RT 不再逐帧 “看” 视频,而是先将整段视频压缩成一个 “全局场景表征”,再通过时空查询的方式,精准定位每个像素在四维时空中的位置。这种 “指哪打哪” 的操作,让 AI 对世界的认知从 “碎片拼图” 升级成了 “完整建模”。

该内容属于精选文章系列, 后获取已享有的阅读权限

升级PRO会员,享有以下权益

  • 解锁泰伯网专业深度文章
  • 免费阅读/下载12篇智库常规报告
  • 免费观看全库直播视频及回放

立即升级会员


还没有泰伯账号?

喜欢您正在阅读的内容吗?欢迎免费订阅泰伯每周精选电邮。 立即订阅

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

泰伯网旗下时空智能、空间智能、具身智能等前沿人工智能技术与城市数字化融合报道

文章: 45
关注度: 159018

更多精选文章推荐

泰伯网旗下时空智能、空间智能、具身智能等前沿人工智能技术与城市数字化融合报道

文章: 45
关注度: 159018