周三的最新消息显示,轨道数据中心初创公司Starcloud已经实现人类首次在太空中训练大语言模型的尝试。该公司上月中旬发射了一颗搭载英伟达H100图形处理单元的卫星。据透露,这颗卫星目前正在轨道上运行基于谷歌开源模型Gemma的应用。卫星传回的消息写道:“地球人,你们好!。”据悉,Starcloud将在下一次定于2026年10月发射的卫星上搭载多块英伟达H100芯片。目标是实现轨道数据中心能源成本比地面数据中心低10倍。
据报道,美国科技巨头Meta在训练其代号为“牛油果”的新模型时,使用了阿里巴巴Qwen模型进行蒸馏优化。知情人士表示,新模型预计将于明年春季某个时间亮相,并可能以“闭源”形式发布,即一种可以被严格控制、且Meta可出售访问权限的模型。
12月10日,中共海南省委关于制定国民经济和社会发展第十五个五年规划的建议发布。其中提出,全面实施“人工智能+”行动。以基础要素突破为支撑,加强高质量数据供给与创新,推进公共数据授权运营和有序开放,搭建多元化数据产品交易与创新应用生态。加快场景培育和开放,在重点产业、文化建设、民生保障、社会治理、生态环保等领域推动人工智能技术规模化应用,加速垂直领域大模型在重点行业落地。推进遥感大数据与人工智能大模型的深度融合与产业化应用,提升空间信息服务智能化、实时化供给能力。
12月2日消息,极佳视界发布并开源具身世界模型GigaWorld-0,成功将世界模型生成数据在VLA训练中的占比提升至90%。所训练的VLA模型在新纹理(训练中未见材质表面)、新视角(训练中未见的观测角度)、新物体位置(训练中未见的空间布局)三大泛化维度上均实现近300%的性能提升,标志着具身智能正式迈入“数据高效、高泛化、低成本”的新阶段。
12月1日,DeepSeek宣布同时发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。官方网页端、App和API均已更新为正式版DeepSeek-V3.2;Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。DeepSeek-V3.2的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用Agent任务场景;V3.2-Speciale是DeepSeek-V3.2的长思考增强版,同时结合了DeepSeek-Math-V2的定理证明能力。
11月28日下午,济南市政府新闻办召开济南市“高质量完成‘十四五’规划——全面提升城市品质”主题新闻发布会。济南市委常委、副市长任庆虎提到,“十四五”以来,济南探索城市治理模式向智能分析、精准服务转变,建成全省首个城市信息模型(CIM)基础平台。“实景三维济南”已建成10244平方公里全域地形级和2200平方公里分辨率优于5cm的城市级地理场景,为城市智慧管理提供高精度的三维可视化支撑。
11月28日,昆仑万维发布Mureka V7.6和Mureka O2模型。新模型在音乐性、编曲能力、音质质感和Prompt贴合度等多个维度相较前序版本实现显著提升。与此同时,Mureka推出的全新模型在响应速度、系统稳定性和推理效率方面也得到大幅增强。
11月27日,DeepSeek在HuggingFace推出新型数学推理模型DeepSeekMath-V2,采用可自我验证的训练框架。该模型基于DeepSeek-V3.2-Exp-Base构建,通过LLM验证器自动审查生成的数学证明,并利用高难度样本持续优化性能。在IMO 2025和CMO 2024中均达到金牌水平,Putnam 2024获118/120分。团队表示,该成果验证了自验证推理路径的可行性,为构建可靠数学智能系统提供新方向。模型代码与权重已开源,发布于Hugging Face及GitHub平台。
11月27日消息,根据麻省理工学院与开源人工智能初创公司Hugging Face的一项最新研究发现,中国在全球开源人工智能模型市场上已超越美国,在这项极具科技含量的全球应用中正占据关键优势。报告显示,过去一年,中国团队自主研发的开源AI模型下载份额占比已上升至17.1%,首次超过美国同行,后者的下载份额占比为15.8%。
11月25日,百度发布设立技术研发组织相关公告,新设基础模型研发部,负责研发高智能可扩展的通用人工智能大模型,由吴甜负责;新设应用模型研发部,负责业务应用场景需要的专精模型调优和探索,由贾磊负责。王海峰继续担任CTO、TSC主席、百度研究院院长,以上部门均向百度CEO李彦宏汇报。百度表示,吴甜和贾磊都是百度培养的技术和管理人才,体现了百度持续推进干部年轻化的进程和决心。同时此次提升大模型技术研发部门的管理层级,采取分进合击的打法,将进一步建设和加强公司在人工智能方向的核心优势,也将更好地满足客户和用户在AI应用上的需求。
11月25日消息,新加坡国家人工智能计划(AISG)正在进行一次重大战略调整,在其最新的东南亚语言大模型项目中,放弃了Meta模型,转向阿里巴巴的通义千问Qwen开源架构,标志着中国开源AI模型在全球影响力版图中的一次关键扩张。据悉,AISG于11月25日宣布推出的“Qwen-SEA-LION-v4”模型,在一项衡量东南亚语言能力的开源榜单上迅速占据首位。这一转变旨在解决一个长期痛点:此前以Meta的Llama系列为代表的开源模型,在处理印尼语、泰语和马来语等区域性语言时表现不佳,严重制约了本地化AI应用的开发效率与性能。
近日,小米宣布具身大模型MiMo-Embodied正式发布并全面开源。据小米方面介绍,该模型同步支持具身智能三大核心任务(可供性推理、任务规划、空间理解)与自动驾驶三大关键任务(环境感知、状态预测、驾驶规划),形成全场景智能支撑。
11月13日,数字空间及空间智能综合解决方案提供商如视,正式发布了其空间大模型Argus 1.0,这也是全球首个(目前也是唯一一个)支持全景图输入,推测空间深度的大模型。Argus 1.0的目标不是「虚构」世界,而是「还原」真实的世界。它能够以毫秒级的速度,从一个场景下的单张或多张全景/普通图像中,推理出所有图像带绝对尺度的相机位姿、深度图和点图。
11月21日消息,谷歌正式推出全新图像生成与编辑模型 Nano Banana Pro (Gemini 3 Pro Image)。该模型基于 Gemini 3 Pro 架构构建,号称能以“前所未有的控制力、完美的文字渲染效果以及增强的世界知识储备”,将用户的构想转化为“工作室级(studio-quality)”的设计作品。即日起,Nano Banana Pro 面向全球用户开放免费试用。用户只需登录 Gemini 应用,选择“生成图像(Create image)”功能,并切换至“Thinking”模式即可体验这一最新模型。