李飞飞团队训练出媲美DeepSeek R1的推理模型云计算费用不到50美元

科创板日报 2025-02-06 18:15

不包括服务器、显卡等硬件投入费用。

李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。

研究人员表示，s1是通过蒸馏法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提炼出来的，使用16个英伟达H100 GPU进行了26分钟的训练。

小K注：“不到50美元”仅为云计算服务费用，不包括服务器、显卡等硬件投入费用，因这部分已经由云厂商承担。

喜欢您正在阅读的内容吗？欢迎免费订阅泰伯每周精选电邮。立即订阅

声明：泰伯网登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述，文章内容仅供参考。

AI时代，时空智能需求爆发式增长！千寻时空服务每月调用量突破万亿次

视点聚焦|陈元副主席热切关注时空产业，鼓励继续发挥硬科技企业优势

申报开启 | WIF2025商业航天十年榜单：探寻企业高成长密码

大疆发布禅思L3激光雷达，全自研国产化，开启平民化航测新篇章

2025-02-06 16:39

李飞飞团队训练出媲美DeepSeek R1的推理模型 云计算费用不到50美元