搜索中心

DeepSeek宣布同时发布两个正式版模型

分享至

12月1日,DeepSeek宣布同时发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。官方网页端、App和API均已更新为正式版DeepSeek-V3.2;Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。DeepSeek-V3.2的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用Agent任务场景;V3.2-Speciale是DeepSeek-V3.2的长思考增强版,同时结合了DeepSeek-Math-V2的定理证明能力。

DeepSeek推出DeepSeekMath‑V2模型

分享至

11月27日,DeepSeek在HuggingFace推出新型数学推理模型DeepSeekMath-V2,采用可自我验证的训练框架。该模型基于DeepSeek-V3.2-Exp-Base构建,通过LLM验证器自动审查生成的数学证明,并利用高难度样本持续优化性能。在IMO 2025和CMO 2024中均达到金牌水平,Putnam 2024获118/120分。团队表示,该成果验证了自验证推理路径的可行性,为构建可靠数学智能系统提供新方向。模型代码与权重已开源,发布于Hugging Face及GitHub平台。

DeepSeek研究员罗福莉加入小米

分享至

11月12日,记者获悉,罗福莉在朋友圈发文:“智能终将从语言迈向物理世界。我正在Xiaomi MiMo,和一群富有创造力、才华横溢且真诚热爱的研究员,致力于构建这样的未来,全力奔赴我们心目中的AGI。”Xiaomi MiMo是小米首个推理大模型。这也是罗福莉正式宣布,自己已经加入小米,亦是对此前传言的回应。此前有传言称,小米创始人雷军以千万年薪招揽DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉,领导小米AI大模型团队。

“2025全球十大工程成就”发布 DeepSeek、人形机器人等入选

分享至

10月13日,2025年世界工程组织联合会全体大会暨全球工程大会在上海世博中心开幕。开幕式上,由中国工程院院刊《Engineering》评选的“2025全球十大工程成就”正式发布,DeepSeek开源大语言模型、人形机器人、南水北调中线工程等入选。

DeepSeek、宇树等入选《时代》最佳发明榜单

分享至

10月10日,美国《时代》杂志公布了2025年度最佳发明榜单,共有300款产品上榜,涵盖机器人技术、无障碍功能、人工智能、设计、健康等多个领域,其中包括宇树科技、DeepSeek、华为、比亚迪、苹果公司的产品。宇树科技Unitree R1人形双足机器人:该人形机器人共有26个关节,使其能够完成复杂动作,如拳击、跑步,甚至翻跟头,令观众惊叹不已。DeepSeek R1推理大模型:今年年初横空出世,仅用数月时间就开发出了在行业标准测试中媲美OpenAI当时最先进产品的模型,而且训练成本仅600万美元,所需算力更是仅为美国竞争对手的零头,且至今仍免费开放使用。

DeepSeek-V3.2-Exp模型正式发布并开源

分享至

9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。

DeepSeek V3.2、GLM4.6等大模型即将发布

分享至

9月29日消息,DeepSeek-V3.2即将发布,据了解,v3.2-base已上传至DeepSeek的HuggingFace官方页面,模型文件正在上传中,不过目前已下线。同时,智谱的GLM-4.6也即将发布,在Z.ai官网可以看到,GLM-4.5标识为上一代旗舰模型。

DeepSeek线上模型升级:当前版本号 DeepSeek-V3.1-Terminus

分享至

DeepSeek线上模型已升级,当前版本号 DeepSeek-V3.1-Terminus。

DeepSeek声明:防范冒用“深度求索”名义实施诈骗

分享至

9月17日,深度求索(DeepSeek)发布官方声明:近期,有不法分子冒充“深度求索”(DeepSeek)官方或在职员工,伪造工牌、营业执照等材料,在多个平台以“算力租赁”、“股权融资”等名义向用户收取费用实施诈骗。该行为严重侵害用户权益,并损害我司声誉。现严正声明如下:1.深度求索从未要求用户向个人账户或非官方账户付款,任何要求私下转账的行为均属诈骗;2.任何冒用我司名义开展“算力租赁”、“融资”等行为均属违法,我们将依法追究其法律责任。

DeepSeek-R1论文登上Nature封面,梁文锋为通讯作者

分享至

9月18日,DeepSeek-R1论文以封面文章的形式登上了权威科学期刊Nature,DeepSeek创始人兼CEO 梁文锋为该论文的通讯作者。DeepSeek-R1也是全球首个经过同行评审的主流大语言模型。Nature评价道:目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白“终于被DeepSeek打破”。有哥伦布俄亥俄州立大学的人工智能研究员称,到目前为止几乎所有大模型在强化学习上都可能以某种方式受到了R1的启发。

DeepSeek目标在今年年底前发布AI智能体

分享至

市场消息:DeepSeek目标是在今年年底前发布AI智能体。

DeepSeek:已在平台内对AI生成合成内容添加标识

分享至

9月1日,DeepSeek发布关于AI生成合成内容标识的公告。公告称,为贯彻落实《人工智能生成合成内容标识办法》(2025年9月1日起施行)及《网络安全技术人工智能生成合成内容标识方法》等国家标准的相关要求,防止AI生成内容可能引发的公众混淆、误认以及信息失实的风险,DeepSeek已在平台内对AI生成合成内容添加标识,并明确提醒用户相关内容由AI生成。用户不得恶意删除、篡改、伪造、隐匿此类生成内容标识,不得利用AI制作、传播虚假信息、侵权信息以及从事任何违法违规活动。同时,公司已发布《模型原理与训练方法说明》,对模型的基本原理、训练数据及内容生成机制予以说明,以帮助用户更全面地理解AI技术、合理使用DeepSeek相关服务,切实保障用户的知情权和控制权,防范因误用或不当使用可能带来的各类风险。

特斯拉与火山引擎达成合作,全新Model Y L车型接入豆包大模型与DeepSeek模型

分享至

特斯拉与字节跳动旗下火山引擎近日达成合作,由火山引擎为特斯拉智能座舱交互体验部分提供大模型服务。根据特斯拉中国官网更新的《特斯拉车机语音助手使用条款》显示,全新上市的特斯拉Model Y L车型将搭载豆包大模型与DeepSeek模型,两款模型均通过火山引擎接入。其中,豆包大模型将承担语音命令功能,如导航设定、媒体播放操控、空调温度调节等,同时还具备车主手册查询功能;DeepSeek模型提供AI语音闲聊服务。

DeepSeek-V3.1正式发布

分享至

8月21日,DeepSeek-V3.1正式发布。本次升级包含以下主要变化:混合推理架构:一个模型同时支持思考模式与非思考模式;更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。官方App与网页端模型已同步升级为DeepSeek-V3.1。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。

2025《财富》中国科技50强出炉:华为、DeepSeek、宇树等在榜

分享至

8月21日,据“财富FORTUNE”官微,2025年“《财富》中国科技50强”榜单出炉,旨在寻找出生于中国、正在影响世界的科技公司。根据榜单,包括华为、阿里、腾讯、字节跳动等互联网科技公司,宁德时代、比亚迪等新能源企业,DeepSeek、宇树科技、云深处科技、文远知行等人工智能企业亦上榜。

DeepSeek AI应用更新:支持对话内容生成分享图

分享至

8月14日消息,DeepSeek App应用日前已更新至1.3.0版本,除了修复部分已知问题,优化选择/复制文本体验之外,本次更新最大的亮点,就是新增了对话内容生成分享图功能。用户更新至新版之后,用户的对话可以通过分享功能生成图片,便于用户分享到微信、微博等平台上。此前报道,近日市场再度传出深度求索下一代大模型DeepSeek-R2的发布消息,预计时间窗口为8月15日至30日。对此,接近DeepSeek人士昨日表示,该消息不实,并确认DeepSeek-R2在8月内并无发布计划。

接近DeepSeek人士确认:DeepSeek-R2在8月内并无发布计划

分享至

近日,市场再度传出DeepSeek下一代大模型DeepSeek-R2的发布消息,预计时间窗口为8月15日至30日。对此,接近DeepSeek人士表示,该消息不实,并确认DeepSeek-R2在8月内并无发布计划。

DeepSeekR2再曝8月发布

分享至

市场期盼‌DeepSeek-R2已经有一段时间,而在ChatGPT-5发布之后,市场对此的预期更盛。8月12日,市场上突然传出,‌DeepSeek-R2的预计发布时间窗口为2025年8月15日至8月30日。但具体日期尚未官宣。记者尝试让‌DeepSeek回答了涉及相关发布日期的问题,该模型亦给出了较为肯定的答案。可能是受此刺激,8月12日早盘,人工智能概念股集体拉升。其中,最值得注意的是每日互动,该股早盘一度大涨12%。‌DeepSeek-R1推出之初,该股由18元/股附近开始起涨,短短几个交易日便突破了70元/股,是当之无愧的‌DeepSeek概念股龙头。他的飙升意味着市场已经在计价这一传闻。

DeepSeek崩了引热议,官方深夜回应:网页/API已恢复

分享至

8月11日,DeepSeek服务突遭全面宕机,API接口、网页平台以及App均无法访问或响应。许多网友也通过微博话题 #DeepSeek崩了# 反馈服务异常。根据DeepSeek在官网发布的公告,DeepSeek网页/API已恢复。公告如下:21:55,该问题已被发现并正在实施修复;22:28,已定位到问题,服务正在逐渐恢复中;23:12,大部分服务已经恢复正常;23:39,此事件已得到解决。

黄仁勋对谈王坚:赞DeepSeek写出A+论文,称“嫉妒年轻人”

分享至

7月17日上午,在链博会先进制造主题活动现场,英伟达公司创始人兼CEO黄仁勋与之江实验室主任、阿里云创始人王坚进行了一场炉边谈话。两人的第一次见面是在近十年前的北京中关村,而王坚上次见到黄仁勋还是很久之前在洛杉矶。再次见面,两人围绕这几年科技领域发生的变化,关于AI、算力以及AI时代下的年轻人,有了一场对谈。黄仁勋关心,近几年哪一个技术变革最让王坚兴奋?比起AI,王坚的回答是算力。王坚表示,算力是一切的基础架构,AI也是基于算力发展起来的。“算力改变了一切,AI是我们看到的一个成果。”王坚说。对于AI领域最近的一次重大改变,黄仁勋说,今年开源模型改变了技术,他看到了很多AI研究都是开源的,出现了大量论文。黄仁勋称,中国研究者发布的(AI相关)论文是全球数量最高的。开源模型是一种很安全的发展方式,可以通过全球的审查确保模型的安全性。黄仁勋说,他看了DeepSeek的论文,写得非常好,是一篇A+的科学论文和A+工程方面的论文。对于年轻人是否应该学习AI、AI时代年轻人面临什么机遇,两人展开了热烈讨论。王坚说,人工智能对我们来说是一个终生的机会,尤其是对年轻人来说。“我甚至有点嫉妒我们的年轻一代。”黄仁勋则表示,出生在这一代的年轻人会成为人工智能的原住民,好像电影《星球大战》里面的人物,可以直接和科技共生,共同成长。黄仁勋说,他羡慕生长在人工智能下的年轻一代,在他很小的时候,不能想象有一个东西来提醒他,或帮他记住每一件事情,“而人工智能会记得这一切,你的人生旅程都会被记录下来。”

点击加载更多