搜索-泰伯网

搜索到 129 条相关内容

DeepSeek使用走私Blackwell芯片训练？英伟达回应：目前还没有看到任何证据

2025-12-12 11:02:56 分享至

12月11日消息，据外媒报道，针对有关中国人工智能初创公司DeepSeek使用走私的Blackwell芯片开发其即将推出的模型的报道，英伟达公司做出了回应。为了在AI竞赛中保持领先地位，美国禁止向中国出口英伟达的Blackwell 芯片，该芯片被认为是该公司最先进的产品。据报道，DeepSeek 据称正在使用未经授权偷运进入该国的芯片。英伟达发言人在一份声明中表示：我们尚未看到任何证据或收到任何关于所谓幽灵数据中心的线索，这些数据中心被建造出来是为了欺骗我们和我们的（原始设备制造商）合作伙伴，然后被拆除、走私并重建在其他地方。虽然这种走私行为听起来不太可能，但我们会认真调查收到的任何线索。

DeepSeek 英伟达

DeepSeek宣布同时发布两个正式版模型

2025-12-02 09:30:49 分享至

12月1日，DeepSeek宣布同时发布两个正式版模型：DeepSeek-V3.2和DeepSeek-V3.2-Speciale。官方网页端、App和API均已更新为正式版DeepSeek-V3.2；Speciale版本目前仅以临时API服务形式开放，以供社区评测与研究。DeepSeek-V3.2的目标是平衡推理能力与输出长度，适合日常使用，例如问答场景和通用Agent任务场景；V3.2-Speciale是DeepSeek-V3.2的长思考增强版，同时结合了DeepSeek-Math-V2的定理证明能力。

DeepSeek 模型

DeepSeek推出DeepSeekMath‑V2模型

2025-11-28 11:06:09 分享至

11月27日，DeepSeek在HuggingFace推出新型数学推理模型DeepSeekMath-V2，采用可自我验证的训练框架。该模型基于DeepSeek-V3.2-Exp-Base构建，通过LLM验证器自动审查生成的数学证明，并利用高难度样本持续优化性能。在IMO 2025和CMO 2024中均达到金牌水平，Putnam 2024获118/120分。团队表示，该成果验证了自验证推理路径的可行性，为构建可靠数学智能系统提供新方向。模型代码与权重已开源，发布于Hugging Face及GitHub平台。

DeepSeek

前DeepSeek研究员罗福莉加入小米

2025-11-12 14:25:07 分享至

11月12日，记者获悉，罗福莉在朋友圈发文：“智能终将从语言迈向物理世界。我正在Xiaomi MiMo，和一群富有创造力、才华横溢且真诚热爱的研究员，致力于构建这样的未来，全力奔赴我们心目中的AGI。”Xiaomi MiMo是小米首个推理大模型。这也是罗福莉正式宣布，自己已经加入小米，亦是对此前传言的回应。此前有传言称，小米创始人雷军以千万年薪招揽DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉，领导小米AI大模型团队。

DeepSeek 罗福莉人事变动小米

“2025全球十大工程成就”发布 DeepSeek、人形机器人等入选

2025-10-13 15:00:38 分享至

10月13日，2025年世界工程组织联合会全体大会暨全球工程大会在上海世博中心开幕。开幕式上，由中国工程院院刊《Engineering》评选的“2025全球十大工程成就”正式发布，DeepSeek开源大语言模型、人形机器人、南水北调中线工程等入选。

DeepSeek 人形机器人

DeepSeek、宇树等入选《时代》最佳发明榜单

2025-10-10 11:07:54 分享至

10月10日，美国《时代》杂志公布了2025年度最佳发明榜单，共有300款产品上榜，涵盖机器人技术、无障碍功能、人工智能、设计、健康等多个领域，其中包括宇树科技、DeepSeek、华为、比亚迪、苹果公司的产品。宇树科技Unitree R1人形双足机器人：该人形机器人共有26个关节，使其能够完成复杂动作，如拳击、跑步，甚至翻跟头，令观众惊叹不已。DeepSeek R1推理大模型：今年年初横空出世，仅用数月时间就开发出了在行业标准测试中媲美OpenAI当时最先进产品的模型，而且训练成本仅600万美元，所需算力更是仅为美国竞争对手的零头，且至今仍免费开放使用。

DeepSeek 宇树

DeepSeek-V3.2-Exp模型正式发布并开源

2025-09-30 10:38:46 分享至

9月29日，DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构，这种架构能够有效降低计算资源消耗并提升模型推理效率。目前，该模型已正式上架华为云大模型即服务平台 MaaS，针对DeepSeek-V3.2-Exp 模型，华为云此次仍沿用大EP并行方案部署，基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略，并兼顾模型时延和吞吐性能。

DeepSeek

DeepSeek V3.2、GLM4.6等大模型即将发布

2025-09-29 17:20:12 分享至

9月29日消息，DeepSeek-V3.2即将发布，据了解，v3.2-base已上传至DeepSeek的HuggingFace官方页面，模型文件正在上传中，不过目前已下线。同时，智谱的GLM-4.6也即将发布，在Z.ai官网可以看到，GLM-4.5标识为上一代旗舰模型。

DeepSeek 大模型

DeepSeek线上模型升级：当前版本号 DeepSeek-V3.1-Terminus

2025-09-23 10:09:35 分享至

DeepSeek线上模型已升级，当前版本号 DeepSeek-V3.1-Terminus。

DeepSeek

DeepSeek声明：防范冒用“深度求索”名义实施诈骗

2025-09-18 15:08:35 分享至

9月17日，深度求索（DeepSeek）发布官方声明：近期，有不法分子冒充“深度求索”（DeepSeek）官方或在职员工，伪造工牌、营业执照等材料，在多个平台以“算力租赁”、“股权融资”等名义向用户收取费用实施诈骗。该行为严重侵害用户权益，并损害我司声誉。现严正声明如下：1.深度求索从未要求用户向个人账户或非官方账户付款，任何要求私下转账的行为均属诈骗；2.任何冒用我司名义开展“算力租赁”、“融资”等行为均属违法，我们将依法追究其法律责任。

DeepSeek 深度求索

DeepSeek-R1论文登上Nature封面，梁文锋为通讯作者

2025-09-18 10:12:04 分享至

9月18日，DeepSeek-R1论文以封面文章的形式登上了权威科学期刊Nature，DeepSeek创始人兼CEO 梁文锋为该论文的通讯作者。DeepSeek-R1也是全球首个经过同行评审的主流大语言模型。Nature评价道：目前几乎所有主流的大模型都还没有经过独立同行评审，这一空白“终于被DeepSeek打破”。有哥伦布俄亥俄州立大学的人工智能研究员称，到目前为止几乎所有大模型在强化学习上都可能以某种方式受到了R1的启发。

DeepSeek Nature 梁文锋

DeepSeek目标在今年年底前发布AI智能体

2025-09-04 16:58:05 分享至

市场消息：DeepSeek目标是在今年年底前发布AI智能体。

DeepSeek AI智能体

DeepSeek：已在平台内对AI生成合成内容添加标识

2025-09-01 18:37:42 分享至

9月1日，DeepSeek发布关于AI生成合成内容标识的公告。公告称，为贯彻落实《人工智能生成合成内容标识办法》（2025年9月1日起施行）及《网络安全技术人工智能生成合成内容标识方法》等国家标准的相关要求，防止AI生成内容可能引发的公众混淆、误认以及信息失实的风险，DeepSeek已在平台内对AI生成合成内容添加标识，并明确提醒用户相关内容由AI生成。用户不得恶意删除、篡改、伪造、隐匿此类生成内容标识，不得利用AI制作、传播虚假信息、侵权信息以及从事任何违法违规活动。同时，公司已发布《模型原理与训练方法说明》，对模型的基本原理、训练数据及内容生成机制予以说明，以帮助用户更全面地理解AI技术、合理使用DeepSeek相关服务，切实保障用户的知情权和控制权，防范因误用或不当使用可能带来的各类风险。

DeepSeek AI

特斯拉与火山引擎达成合作，全新Model Y L车型接入豆包大模型与DeepSeek模型

2025-08-22 14:56:11 分享至

特斯拉与字节跳动旗下火山引擎近日达成合作，由火山引擎为特斯拉智能座舱交互体验部分提供大模型服务。根据特斯拉中国官网更新的《特斯拉车机语音助手使用条款》显示，全新上市的特斯拉Model Y L车型将搭载豆包大模型与DeepSeek模型，两款模型均通过火山引擎接入。其中，豆包大模型将承担语音命令功能，如导航设定、媒体播放操控、空调温度调节等，同时还具备车主手册查询功能；DeepSeek模型提供AI语音闲聊服务。

特斯拉火山引擎豆包 DeepSeek

DeepSeek-V3.1正式发布

2025-08-21 15:30:43 分享至

8月21日，DeepSeek-V3.1正式发布。本次升级包含以下主要变化：混合推理架构：一个模型同时支持思考模式与非思考模式；更高的思考效率：相比DeepSeek-R1-0528，DeepSeek-V3.1-Think能在更短时间内给出答案；更强的Agent能力：通过Post-Training优化，新模型在工具使用与智能体任务中的表现有较大提升。官方App与网页端模型已同步升级为DeepSeek-V3.1。用户可以通过“深度思考”按钮，实现思考模式与非思考模式的自由切换。

DeepSeek

2025《财富》中国科技50强出炉：华为、DeepSeek、宇树等在榜

2025-08-21 14:28:54 分享至

8月21日，据“财富FORTUNE”官微，2025年“《财富》中国科技50强”榜单出炉，旨在寻找出生于中国、正在影响世界的科技公司。根据榜单，包括华为、阿里、腾讯、字节跳动等互联网科技公司，宁德时代、比亚迪等新能源企业，DeepSeek、宇树科技、云深处科技、文远知行等人工智能企业亦上榜。

《财富》华为 DeepSeek 宇树

DeepSeek AI应用更新：支持对话内容生成分享图

2025-08-15 10:41:35 分享至

8月14日消息，DeepSeek App应用日前已更新至1.3.0版本，除了修复部分已知问题，优化选择/复制文本体验之外，本次更新最大的亮点，就是新增了对话内容生成分享图功能。用户更新至新版之后，用户的对话可以通过分享功能生成图片，便于用户分享到微信、微博等平台上。此前报道，近日市场再度传出深度求索下一代大模型DeepSeek-R2的发布消息，预计时间窗口为8月15日至30日。对此，接近DeepSeek人士昨日表示，该消息不实，并确认DeepSeek-R2在8月内并无发布计划。

DeepSeek AI

接近DeepSeek人士确认：DeepSeek-R2在8月内并无发布计划

2025-08-13 13:09:20 分享至

近日，市场再度传出DeepSeek下一代大模型DeepSeek-R2的发布消息，预计时间窗口为8月15日至30日。对此，接近DeepSeek人士表示，该消息不实，并确认DeepSeek-R2在8月内并无发布计划。

DeepSeek

DeepSeekR2再曝8月发布

2025-08-13 10:19:51 分享至

市场期盼‌DeepSeek-R2已经有一段时间，而在ChatGPT-5发布之后，市场对此的预期更盛。8月12日，市场上突然传出，‌DeepSeek-R2的预计发布时间窗口为2025年8月15日至8月30日。但具体日期尚未官宣。记者尝试让‌DeepSeek回答了涉及相关发布日期的问题，该模型亦给出了较为肯定的答案。可能是受此刺激，8月12日早盘，人工智能概念股集体拉升。其中，最值得注意的是每日互动，该股早盘一度大涨12%。‌DeepSeek-R1推出之初，该股由18元/股附近开始起涨，短短几个交易日便突破了70元/股，是当之无愧的‌DeepSeek概念股龙头。他的飙升意味着市场已经在计价这一传闻。

DeepSeekR2

DeepSeek崩了引热议，官方深夜回应：网页/API已恢复

2025-08-12 10:14:15 分享至

8月11日，DeepSeek服务突遭全面宕机，API接口、网页平台以及App均无法访问或响应。许多网友也通过微博话题 #DeepSeek崩了# 反馈服务异常。根据DeepSeek在官网发布的公告，DeepSeek网页/API已恢复。公告如下：21:55，该问题已被发现并正在实施修复；22:28，已定位到问题，服务正在逐渐恢复中；23:12，大部分服务已经恢复正常；23:39，此事件已得到解决。

DeepSeek

点击加载更多

搜索中心