分享
Scan me 分享到微信

AI星球 | 智源登Nature:Sora不是唯一答案,世界模型出现分叉口

智源研究院推出的多模态大模型“悟界·Emu”登上Nature正刊

封面、内文图源:AI生成

撰文丨泰伯网 乔帅


泰伯网讯,近日,北京智源人工智能研究院(下称“智源研究院”)推出的多模态大模型“悟界·Emu”登上Nature正刊,成为继DeepSeek之后第二个达成此成就的中国大模型团队研究成果,也是中国首篇多模态大模型路线的Nature论文。

据智源研究院微信公众号,1月28日,智源多模态大模型成果"Multimodal learning with next-token prediction for large multimodal models(通过预测下一个词元进行多模态学习的多模态大模型)"上线国际顶级学术期刊Nature,预计2月12日纸质版正式刊发。

图源:Nature官网

Nature编辑点评这项研究:Emu3仅基于预测下一个词元(Next-token prediction),实现了大规模文本、图像和视频的统一学习,其在生成与感知任务上的性能可与使用专门路线相当,这一成果对构建可扩展、统一的多模态智能系统具有重要意义,有望推动原生多模态助手、世界模型以及具身智能等方向的发展。

图源:智源研究院

资料显示,Emu3模型于2024年2月立项,当时团队重审大模型发展路径。随着GPT-4、Sora爆火,“预测下一个token”自回归路线改变语言模型领域,引发AGI早期迹象讨论。

该内容属于精选文章系列, 后获取已享有的阅读权限

升级PRO会员,享有以下权益

  • 解锁泰伯网专业深度文章
  • 免费阅读/下载12篇智库常规报告
  • 免费观看全库直播视频及回放

立即升级会员


还没有泰伯账号?

喜欢您正在阅读的内容吗?欢迎免费订阅泰伯每周精选电邮。 立即订阅

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

泰伯网旗下时空智能、空间智能、具身智能等前沿人工智能技术与城市数字化融合报道

文章: 45
关注度: 159023

更多精选文章推荐

泰伯网旗下时空智能、空间智能、具身智能等前沿人工智能技术与城市数字化融合报道

文章: 45
关注度: 159023