搜索中心

OpenAI发布全新安全推理模型

分享至

10月29日,OpenAI正式发布两款全新开源安全推理模型gpt-oss-safeguard-120b与gpt-oss-safeguard-20b。

xAI推出高效推理模型Grok Code Fast 1

分享至

8月29日,xAI宣布推出高效推理模型Grok Code Fast 1,擅长智能化编程。xAI表示,Grok Code Fast 1将在包括Cursor、GitHub Copilot、Cline、opencode、Windsurf、Roo Code和Kilo Code在内的主流智能编程平台上限时免费开放。

英伟达推出具身智能推理模型Cosmos Reason

分享至

在当地时间周一揭幕的行业顶级会议SIGGRAPH(国际计算机协会计算机图形学和交互技术特别兴趣小组年度会议)上,“全球股王”英伟达推出一系列面向机器人开发者的世界模型、应用库和基础设施。其中,最引人关注的是参数量只有70亿的开源物理AI应用和机器人视觉推理模型Cosmos Reason。凭借记忆和理解能力,Cosmos Reason能够使机器人和AI具身代理“像人类一样推理”,并在真实世界中采取行动。

消息称百度最快8月底发布新版推理模型

分享至

8月7日消息,消息称,百度最快将在8月底推出文心大模型最新版推理模型,目前该模型正在全力测试中。据悉,文心新版推理模型将在逻辑推理、复杂计算等能力上超越OpenAI o3满血版。百度还计划未来数月内发布文心基座大模型最新版,有内部人士指出,新模型在百度世界大会上发布的概率极大。

腾讯混元推出首款开源混合推理模型

分享至

6月27日,腾讯混元宣布开源首个混合推理MoE模型 Hunyuan-A13B,总参数80B,激活参数仅13B。即日起,模型已经在Github和Huggingface等开源社区上线,同时模型API也在腾讯云官网正式上线,支持快速接入部署。这是业界首个13B级别的MoE开源混合推理模型,在Agent工具调用和长文能力上有突出表现。

​智谱将开源推理模型GLM-Z1-Air和基座模型GLM-4-Air0414

分享至

3月31日,智谱将于4月14日开源推理模型GLM-Z1-Air和基座模型GLM-4-Air0414,并于近期陆续上线bigmodel.cn。上述模型是智谱新推出的AI Agent“沉思”背后的模型。

阿里通义千问正式推出QVQ-Max视觉推理模型的第一版

分享至

去年12月,阿里通义千问推出了QVQ-72B-Preview, 作为一个探索模型,它存在一些不足之处。今天,我们正式推出 QVQ-Max 视觉推理模型的第一版。这一新版本的模型具备强大的多模态处理能力,它不仅能够“看懂”图片和视频里的内容,还能结合这些信息进行分析、推理,甚至给出解决方案。从数学题到生活小问题,从编程代码到艺术创作,QVQ-Max 都表现出了不俗的能力。

昆仑万维开源R1V视觉思维链推理模型

分享至

3月18日,昆仑万维正式开源首款工业界多模态思维链推理模型Skywork R1V,即日起开源模型权重和技术报告。

阿里发布并开源推理模型通义千问QwQ-32B

分享至

3月6日,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B,阿里巴巴称,这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。

阿里即将推出基于Qwen2.5-MAX的深度推理模型

分享至

2月20日消息,阿里巴巴集团CEO吴泳铭在财报会上表示,阿里将于近期发布基于千问Qwen2.5-MAX的深度推理模型。1月底,阿里发布了AI基础大模型千问旗舰版Qwen2.5-MAX,在多项权威基准评测中,其处于业界领先水平。目前,Qwen的全球衍生模型已突破9万个,全球排名第一。

科大讯飞发布深度推理模型讯飞星火X1,同时首发星火语音同传大模型

分享至

据科大讯飞官方微博,1月15日,讯飞星火大模型升级发布,正式发布星火深度推理模型X1,讯飞星火4.0 Turbo底座能力迎来全新升级,同时首发星火语音同传大模型。

科大讯飞将于1月15日发布讯飞星火深度推理模型X1

分享至

科大讯飞在1月7日的办公智能体产品升级发布会上宣布,将于1月15日对外发布“讯飞星火深度推理模型X1”,该模型将为讯飞智能体产品注入更强大的AI能力,进一步拓展智慧办公的应用边界。 ​

智谱深度推理模型 GLM-Zero 预览版上线

分享至

2024年12月31日,智谱宣布深度推理模型 GLM-Zero 的初代版本 GLM-Zero-Preview 上线。据官方介绍,这是智谱首个基于扩展强化学习技术训练的推理模型。其专注于增强 AI 推理能力的模型,擅长处理数理逻辑、代码和需要深度推理的复杂问题。在同基座模型相比,GLM-Zero-Preview 在不显著降低通用任务能力的情况下,在专家任务能力方面的表现大幅提升,其在 AIME 2024、MATH500 和 LiveCodeBench 评测中,效果与 OpenAI o1-preview 相当。官方也表示,目前的 GLM-Zero-Preview 与 OpenAI 的 o3 模型仍有不少的差距,在未来智谱也持续优化迭代。

阿里云通义开源首个多模态推理模型QVQ,视觉推理比肩OpenAI o1

分享至

12月25日,阿里云通义千问发布业界首个开源多模态推理模型QVQ-72B-Preview。QVQ展现出超预期的视觉理解和推理能力,在解决数学、物理、科学等领域的复杂推理问题上表现尤为突出。多项评测数据显示,QVQ超越了此前的视觉理解模型「开源王者」Qwen2-VL,整体表现与「满血版」OpenAI o1、Claude3.5 Sonnet等推理模型相当。目前,开发者可在魔搭社区和HuggingFace平台上直接体验。

OpenAI推出“满血版”推理模型o1和ChatGPT Pro

分享至

OpenAI当地时间12月5日宣布推出“满血版”推理模型o1和ChatGPT Pro(每月订阅费200美元)。OpenAI o1现已全面推出给ChatGPT Plus、Team和Pro用户。ChatGPT Pro能够提供最好的模型和工具,包括无限制地访问OpenAI o1和o1的Pro-only版本,可以思考更长的时间以获得更可靠的响应。

月之暗面发布数学推理模型

分享至

11月16日消息,月之暗面旗下Kimi发布新一代数学推理模型k0-math。基准测试显示,Kimi k0-math数学能力可对标OpenAI o1系列可公开使用的两个模型:o1-mini和o1-preview。月之暗面创始人杨植麟认为,最适合让AI去锻炼思考能力的场景就是数学场景。