11月26日,腾讯混元3D创作引擎国际站正式上线。从现在起,海外用户无需下载或配置任何开发环境,只需注册登录,就能直接用文字、图片或草图生成3D作品。同时,混元3D模型API也已在腾讯云国际站同步开放。
11月21日,在腾讯全球数字生态大会无锡峰会上,腾讯集团副总裁、政企业务总裁李强透露,腾讯混元3D正加速出海进程,近期即将推出国际站,面向全球用户开放。混元3D模型API也已经在腾讯云国际站上线,开发者和企业用户可快捷接入。
9月28日,腾讯混元发布并开源原生多模态生图模型“混元图像3.0(HunyuanImage 3.0)”。据腾讯官方介绍,这是首个工业级原生多模态生图模型,参数规模80B,也是目前测评效果最好、参数量最大的开源生图模型,效果可对标业界头部闭源模型。
9月26日,混元3D生成模型家族迎新——混元3D-Omni、混元3D-Part发布并开源。这是腾讯混元在可控3D生成上的新突破,让AI 3D建模更具实用性,加速3D生成模型在游戏、打印和AR/VR 等实际生产流程中的落地应用。
9月19日,腾讯宣布,混元3D AI创作引擎迎来升级,专为3D设计师、游戏开发者、建模师等打造的专业级AI工作台,混元3D Studio正式发布。据了解,基于混元美术级3D生成模型PolyGen,混元3D Studio升级低模拓扑功能,新增低、中、高三档面数控制,满足用户对模型面数的多样化需求。
9月16日,在2025腾讯全球数字生态大会上,腾讯混元3D3.0模型正式发布。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生介绍,混元3D3.0模型建模精度比上一版提升了3倍,人物、复杂细节的生成效果大幅提升。同时,腾讯推出面向3D专业生产管线的一站式工具——混元3D Studio,覆盖从概念设计到动作系统的全流程,解决传统3D开发管线中,生产环节多、制作成本高等问题,大幅提升3D生产效率,助力游戏开发、动画制作、工业设计等产业应用。
9月9日晚间,腾讯混元最新的生图模型“混元图像2.1(HunyuanImage 2.1)”正式发布,支持最长达1000个tokens的提示词,支持原生2K生图。此外,腾讯混元方面透露,“混元原生多模态图像生成模型,也在路上了。”本次,混元还开源中英文改写模型——混元文本改写模型(PromptEnhancer),能够对用户的文本指令进行结构化优化。
8月4日,腾讯混元宣布开源四款小尺寸模型,参数分别为 0.5B、1.8B、4B、7B,消费级显卡即可运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调。
7月27日,2025世界人工智能大会腾讯论坛上,腾讯正式发布混元3D世界模型1.0,并宣布全面开源。这是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型,为游戏开发、VR、数字内容创作等领域带来了全新的可能性。除3D模型外,腾讯混元还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划。目前,混元3D世界模型1.0已全面开源。从秒级生成单个3D资产,到一键打造可漫游的3D世界,腾讯混元正逐步构建完善的3D内容生成生态。
7月27日消息,原通义实验室应用视觉团队负责人薄列峰已加入腾讯混元大模型团队,直接向腾讯副总裁兼混元项目负责人蒋杰汇报。据悉,薄列峰在今年4月30日从阿里离任,彼时曾有传闻称他已加盟某大型互联网企业,在美国任职,并负责多模态模型方向的全面工作,直接向公司高管汇报。薄列峰于2022年加入阿里,起初接棒谭平领导达摩院XR实验室,后调至通义实验室主导应用视觉方向,成为推动阿里图像与视频AIGC技术的重要人物。
6月27日,腾讯混元宣布开源首个混合推理MoE模型 Hunyuan-A13B,总参数80B,激活参数仅13B。即日起,模型已经在Github和Huggingface等开源社区上线,同时模型API也在腾讯云官网正式上线,支持快速接入部署。这是业界首个13B级别的MoE开源混合推理模型,在Agent工具调用和长文能力上有突出表现。
据腾讯官方,CVPR2025(计算机视觉领域顶会之一)上,腾讯宣布混元3D 2.1大模型对外开源,这是首个全链路开源的工业级3D生成大模型。据介绍,混元3D 2.1模型将从模型权重、训练代码,到数据处理流程上全链路开源。
5月20日,腾讯正式发布混元游戏视觉生成平台,这是依托混元大模型打造的首个工业级AIGC游戏内容生产引擎,大幅优化游戏资产生成与游戏制作流程。其面向游戏工业级内容生产,为游戏美术设计师提供一系列AI工具,帮助游戏设计厂商快速生成符合创作意图的高质量游戏素材/概念草案,让游戏美术设计效率提升数十倍。目前,该“混元游戏”通过腾讯混元官网提供体验入口,面向游戏行业设计师开放申请。
5月16日,腾讯发布最新混元图像2.0模型(Hunyuan Image2.0)。腾讯混元表示,相比前代模型,腾讯混元图像2.0模型参数量提升了一个数量级,可实现毫秒级响应,支持用户可以一边打字或者一边说话一边出图。新模型图像生成质量提升明显,可有效避免AIGC图像中的“AI味”模型于即日起在腾讯混元官方网站上线,并对外开放注册体验。
专注于高级大语言模型开发的WizardLM项目创建者徐灿日前发文表示,他和团队离开微软,加入了腾讯的AI开发组织——混元(Hunyuan),“我们将继续我们的使命,推动LLM培训技术的发展,并构建更好的AI模型。”据知情人士透露,WizardLM团队有6名主力成员,大部分已经离开微软。
5月9日,腾讯混元团队发布并开源全新的多模态定制化视频生成工具HunyuanCustom。该模型基于混元视频生成大模型(HunyuanVideo)打造,在主体一致性效果超过现有的开源方案,并可媲美顶尖闭源模型。HunyuanCustom融合了文本、图像、音频、视频等多模态输入生视频的能力,是一款具备高度控制力和生成质量的智能视频创作工具。
4月23日,腾讯混元3D生成模型正式发布2.5版本新模型,建模精细度上大幅提升,实现超高清的几何细节建模,表面更平整、边缘更锐利、细节更丰富。在模型架构上,混元3D v2.5也实现了全面升级,总参数量从1B提升至10B,有效面片数增加超10倍。混元3D AI创作引擎全面更新至v2.5模型底座,同时免费生成额度翻倍,提升至每天20次。混元3D生成API也已正式上线腾讯云,面向企业和开发者开放。
3月21日,腾讯混元宣布,正式推出自研深度思考模型混元T1正式版。在体现推理模型基础能力的常见benchmark上,如大语言模型评估增强数据集MMLU-PRO中,混元T1取得87.2分,仅次于o1。在CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩也达到业界领先推理模型的水平。
3月18日,腾讯混元宣布推出5个全新3D生成模型,在生成速度、细节和材质表达上均有提升,并且全部开源。 同时,其自研的3D AI创作引擎也迎来升级,新增多视图输入、模型智能减面、格式全兼容等能力,面向C端用户全面开放使用。最新开源模型包括多视角形状模型Hunyuan3D-2mv和0.6B形状模型Hunyuan3D-2mini等。