12月2日消息,极佳视界发布并开源具身世界模型GigaWorld-0,成功将世界模型生成数据在VLA训练中的占比提升至90%。所训练的VLA模型在新纹理(训练中未见材质表面)、新视角(训练中未见的观测角度)、新物体位置(训练中未见的空间布局)三大泛化维度上均实现近300%的性能提升,标志着具身智能正式迈入“数据高效、高泛化、低成本”的新阶段。
12月1日,DeepSeek宣布同时发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。官方网页端、App和API均已更新为正式版DeepSeek-V3.2;Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。DeepSeek-V3.2的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用Agent任务场景;V3.2-Speciale是DeepSeek-V3.2的长思考增强版,同时结合了DeepSeek-Math-V2的定理证明能力。
11月28日下午,济南市政府新闻办召开济南市“高质量完成‘十四五’规划——全面提升城市品质”主题新闻发布会。济南市委常委、副市长任庆虎提到,“十四五”以来,济南探索城市治理模式向智能分析、精准服务转变,建成全省首个城市信息模型(CIM)基础平台。“实景三维济南”已建成10244平方公里全域地形级和2200平方公里分辨率优于5cm的城市级地理场景,为城市智慧管理提供高精度的三维可视化支撑。
11月28日,昆仑万维发布Mureka V7.6和Mureka O2模型。新模型在音乐性、编曲能力、音质质感和Prompt贴合度等多个维度相较前序版本实现显著提升。与此同时,Mureka推出的全新模型在响应速度、系统稳定性和推理效率方面也得到大幅增强。
11月27日,DeepSeek在HuggingFace推出新型数学推理模型DeepSeekMath-V2,采用可自我验证的训练框架。该模型基于DeepSeek-V3.2-Exp-Base构建,通过LLM验证器自动审查生成的数学证明,并利用高难度样本持续优化性能。在IMO 2025和CMO 2024中均达到金牌水平,Putnam 2024获118/120分。团队表示,该成果验证了自验证推理路径的可行性,为构建可靠数学智能系统提供新方向。模型代码与权重已开源,发布于Hugging Face及GitHub平台。
11月27日消息,根据麻省理工学院与开源人工智能初创公司Hugging Face的一项最新研究发现,中国在全球开源人工智能模型市场上已超越美国,在这项极具科技含量的全球应用中正占据关键优势。报告显示,过去一年,中国团队自主研发的开源AI模型下载份额占比已上升至17.1%,首次超过美国同行,后者的下载份额占比为15.8%。
11月25日,百度发布设立技术研发组织相关公告,新设基础模型研发部,负责研发高智能可扩展的通用人工智能大模型,由吴甜负责;新设应用模型研发部,负责业务应用场景需要的专精模型调优和探索,由贾磊负责。王海峰继续担任CTO、TSC主席、百度研究院院长,以上部门均向百度CEO李彦宏汇报。百度表示,吴甜和贾磊都是百度培养的技术和管理人才,体现了百度持续推进干部年轻化的进程和决心。同时此次提升大模型技术研发部门的管理层级,采取分进合击的打法,将进一步建设和加强公司在人工智能方向的核心优势,也将更好地满足客户和用户在AI应用上的需求。
11月25日消息,新加坡国家人工智能计划(AISG)正在进行一次重大战略调整,在其最新的东南亚语言大模型项目中,放弃了Meta模型,转向阿里巴巴的通义千问Qwen开源架构,标志着中国开源AI模型在全球影响力版图中的一次关键扩张。据悉,AISG于11月25日宣布推出的“Qwen-SEA-LION-v4”模型,在一项衡量东南亚语言能力的开源榜单上迅速占据首位。这一转变旨在解决一个长期痛点:此前以Meta的Llama系列为代表的开源模型,在处理印尼语、泰语和马来语等区域性语言时表现不佳,严重制约了本地化AI应用的开发效率与性能。
近日,小米宣布具身大模型MiMo-Embodied正式发布并全面开源。据小米方面介绍,该模型同步支持具身智能三大核心任务(可供性推理、任务规划、空间理解)与自动驾驶三大关键任务(环境感知、状态预测、驾驶规划),形成全场景智能支撑。
11月13日,数字空间及空间智能综合解决方案提供商如视,正式发布了其空间大模型Argus 1.0,这也是全球首个(目前也是唯一一个)支持全景图输入,推测空间深度的大模型。Argus 1.0的目标不是「虚构」世界,而是「还原」真实的世界。它能够以毫秒级的速度,从一个场景下的单张或多张全景/普通图像中,推理出所有图像带绝对尺度的相机位姿、深度图和点图。
11月21日消息,谷歌正式推出全新图像生成与编辑模型 Nano Banana Pro (Gemini 3 Pro Image)。该模型基于 Gemini 3 Pro 架构构建,号称能以“前所未有的控制力、完美的文字渲染效果以及增强的世界知识储备”,将用户的构想转化为“工作室级(studio-quality)”的设计作品。即日起,Nano Banana Pro 面向全球用户开放免费试用。用户只需登录 Gemini 应用,选择“生成图像(Create image)”功能,并切换至“Thinking”模式即可体验这一最新模型。
11月19日,OpenAI推出GPT-5.1-Codex-Max智能体编程模型,取代原GPT-5.1-Codex成为Codex界面默认模型。该模型引入“压缩”机制,可在数百万token上下文中持续高效运行,并在SWE-Bench Verified等基准测试中表现优于Gemini 3 Pro。新模型已集成至OpenAI旗下多个开发工具,支持实时交互与复杂任务处理,但暂未开放公共API。开发者需通过付费订阅使用,普通用户可通过ChatGPT Plus及以上版本体验。
日前,Gartner®发布2025年度全球《AI应用开发平台魔力象限》:凭借豆包大模型和火山方舟大模型服务平台 ,火山引擎领跑全球挑战者象限,在中国厂商中位居第一,阿里云、腾讯云也入围挑战者象限,谷歌、亚马逊、微软、IBM位列全球领导者象限。
预算金额为3779.73万元(采购包1:817.263万元,采购包2:2962.467万元)。