11月26日,腾讯混元3D创作引擎国际站正式上线。从现在起,海外用户无需下载或配置任何开发环境,只需注册登录,就能直接用文字、图片或草图生成3D作品。同时,混元3D模型API也已在腾讯云国际站同步开放。
11月23日消息,Meta近日推出了WorldGen,这是一种端到端系统,可仅凭单条文本提示词,自动生成可交互、可导航的三维世界,不仅具备高度沉浸感,更支持用户真正步入其中、自由探索。根据Meta旗下Reality Labs的一份最新技术报告,WorldGen能够在大约五分钟内,根据单个文本提示生成可穿越和交互式的3D世界。虽然该技术目前仍处于研究阶段,但WorldGen架构解决了阻碍生成式人工智能在专业工作流程中发挥作用的特定痛点:功能交互性、引擎兼容性和编辑控制。
11月21日,在腾讯全球数字生态大会无锡峰会上,腾讯集团副总裁、政企业务总裁李强透露,腾讯混元3D正加速出海进程,近期即将推出国际站,面向全球用户开放。混元3D模型API也已经在腾讯云国际站上线,开发者和企业用户可快捷接入。
11月13日,中国航发集团宣布,其自主研制的3D打印极简涡喷发动机成功完成首次飞行试验。本次试验持续30分钟,飞行高度达到6000米,最大飞行速度为0.75马赫,发动机全状态工作,各项参数正常。中国航发动研所总师办主任米栋指出,此次试验的成功验证了发动机在高海拔和复杂环境下的可靠性,以及与飞行器的适配性,为巡飞弹、无人机、靶机等提供了新型动力解决方案。该发动机采用3D打印技术,整机超过四分之三重量的零件均采用3D打印制造,实现了轻量化和高性能的设计目标。
10月23日,字节跳动Seed团队宣布推出3D生成大模型——Seed3D 1.0,实现从单张图像到高质量仿真级3D模型的端到端生成。据介绍,Seed3D 1.0采用生成式AI广泛应用的模型架构Diffusion Transformer,来设计3D几何生成和纹理贴图模型。未来,团队将尝试引入多模态大语言模型(MLLM)来提升3D生成的质量和鲁棒性,并推动3D生成模型在世界模拟器中的大规模应用。
9月26日,混元3D生成模型家族迎新——混元3D-Omni、混元3D-Part发布并开源。这是腾讯混元在可控3D生成上的新突破,让AI 3D建模更具实用性,加速3D生成模型在游戏、打印和AR/VR 等实际生产流程中的落地应用。
9月19日,腾讯宣布,混元3D AI创作引擎迎来升级,专为3D设计师、游戏开发者、建模师等打造的专业级AI工作台,混元3D Studio正式发布。据了解,基于混元美术级3D生成模型PolyGen,混元3D Studio升级低模拓扑功能,新增低、中、高三档面数控制,满足用户对模型面数的多样化需求。
9月17日,,斯坦福大学教授李飞飞的创业公司World Labs发布了新成果 —— 限量开放的测试预览版空间智能模型Marble。「只需一张图片,就能生成持久存在的3D世界,比以往更宏大、更震撼!」当被问到与谷歌的Genie有什么区别时,李飞飞表示,「我们生成的3D世界是永久存在的,用户可以自由地在其中导航探索,而这一切对你来说完全免费。」
9月16日,在2025腾讯全球数字生态大会上,腾讯混元3D3.0模型正式发布。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生介绍,混元3D3.0模型建模精度比上一版提升了3倍,人物、复杂细节的生成效果大幅提升。同时,腾讯推出面向3D专业生产管线的一站式工具——混元3D Studio,覆盖从概念设计到动作系统的全流程,解决传统3D开发管线中,生产环节多、制作成本高等问题,大幅提升3D生产效率,助力游戏开发、动画制作、工业设计等产业应用。
8月28日消息,3D大模型公司“影眸科技”已完成新一轮数千万美金融资,由蓝驰创投领投,字节跳动、红杉中国种子基金等老股东跟投。这是影眸科技今年完成的第二轮融资。据了解,团队即将于下月在其3D生成平台hyper3d.ai上线百亿参数级新模型Rodin Gen-2,该模型相关技术论文在ACM SIGGRAPH获得了包括最佳论文在内的多项荣誉,在内测阶段就与多家全球知名公司达成深度合作。
8月26日,据《读佳》报道,字节的豆包内部正在研发测试名为“3D Model Generator”的3D模型生成工具。该工具致力于可控大规模生成模型,为创建高质量3D资产提供有力支持,尤其在游戏中的3D建模领域。该工具或不久后对外开放使用。从测试页面可以看出,“3D Model Generator”支持两种生成方式,一种是基于图像生成,选取本地图像文件,点击“生成”,即可快速生成3D模型,降低了3D建模的入门门槛。另外一种是基于图像+模型生成,通过图像文件与模型文件的结合,实现更复杂或更具针对性的3D资产创作。
7月27日,2025世界人工智能大会腾讯论坛上,腾讯正式发布混元3D世界模型1.0,并宣布全面开源。这是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型,为游戏开发、VR、数字内容创作等领域带来了全新的可能性。除3D模型外,腾讯混元还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划。目前,混元3D世界模型1.0已全面开源。从秒级生成单个3D资产,到一键打造可漫游的3D世界,腾讯混元正逐步构建完善的3D内容生成生态。
据腾讯官方,CVPR2025(计算机视觉领域顶会之一)上,腾讯宣布混元3D 2.1大模型对外开源,这是首个全链路开源的工业级3D生成大模型。据介绍,混元3D 2.1模型将从模型权重、训练代码,到数据处理流程上全链路开源。
6月10日,3D大模型公司VAST宣布完成数千万美元Pre-A+轮融资。本轮投资由北京市人工智能产业投资基金领投,靖亚资本跟投。同时,VAST正式发布全球首个AI驱动的一站式3D工作台Tripo Studio,并即将推出新算法Tripo 3.0。
5月28日消息,欧洲知名3D AI研究员、慕尼黑工业大学视觉计算与人工智能实验室的Matthias Niessner,已暂停学术工作,创办了一家初创公司SpAItial。Niessner曾是AI虚拟人创业公司Synthesia的联合创始人,他已为SpAItial筹集了1300万美元的种子轮融资——这个金额对欧洲初创公司来说极为罕见。此次融资由欧洲知名早期投资机构Earlybird Venture Capital领投(曾投资UiPath和Peak Games等),Speedinvest和多位重量级天使投资人也参与其中。SpAItial目前尚未展示出太多成果,只有一段预热视频演示了如何通过文本生成一个3D房间。Niessner的技术团队包括:Ricardo Martin-Brualla,曾参与谷歌3D远程会议平台(现称为Beam)的开发;David Novotny,曾在Meta工作六年,负责领导文本生成3D资产的项目等。
近日,空间智能企业群核科技与全球顶尖3D大模型公司VAST正式签署战略合作协议。双方将在应用场景、技术研发、资源共享、数据共建与生态探索等多维度深度合作,致力于为家装电商、设计教育、数字孪生、具身智能等领域提供高效、普惠的数字化智能解决方案。
5月19日消息,苹果的机器学习团队与南京大学及香港科技大学的研究人员合作,发布了一款名为 Matrix3D 的全新3D人工智能模型。这款被称为“大型摄影测量模型”(Large Photogrammetry Model)的系统,能够仅通过几张二维图片就重建出三维物体与场景,而且它在实现方式上与当前的主流技术路径有着显著不同。摄影测量技术是通过照片进行测量,以此来构建3D模型或地图。Matrix3D 的成果令人惊艳:仅需三张输入图片,就可以生成高质量的3D物体甚至完整环境的重建。这种能力对于苹果的沉浸式设备,例如 Vision Pro,有着极具潜力的应用场景。
4月23日,腾讯混元3D生成模型正式发布2.5版本新模型,建模精细度上大幅提升,实现超高清的几何细节建模,表面更平整、边缘更锐利、细节更丰富。在模型架构上,混元3D v2.5也实现了全面升级,总参数量从1B提升至10B,有效面片数增加超10倍。混元3D AI创作引擎全面更新至v2.5模型底座,同时免费生成额度翻倍,提升至每天20次。混元3D生成API也已正式上线腾讯云,面向企业和开发者开放。