分享
Scan me 分享到微信

对标DeepSeeK!200亿AI独角兽反击,算力成本仅53万美元

甚至在部分任务上超越了DeepSeek、阿里、字节等国内企业。

近日,AI创业公司MiniMax推出了首款推理模型M1。从基准评测结果来看,M1性能表现优异,超越了国内闭源模型,接近海外最领先的模型水平,甚至在部分任务上超越了DeepSeek、阿里、字节等国内企业,以及OpenAI、谷歌和Anthropic等国外企业的最新、最强的开闭源模型。

在与DeepSeek R1的对比中,M1展现出明显的算力成本优势。当生成64K token时,M1消耗的算力不到DeepSeek R1的50%;生成100K token时,这一比例更是降至25%。

MiniMax表示,M1整个强化学习过程仅使用了512块英伟达H800 GPU进行三周训练,租赁成本为53.74万美元(约合380万人民币)。这一成本控制效果“比最初预期少了一个数量级”。

喜欢您正在阅读的内容吗?欢迎免费订阅泰伯每周精选电邮。 立即订阅

参与评论

【登录后才能评论哦!点击

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回复{{item.replynum}}
    {{child.username}} 回复 {{child.to_username}}:{{child.content}}

更多精选文章推荐