近日,AI创业公司MiniMax推出了首款推理模型M1。从基准评测结果来看,M1性能表现优异,超越了国内闭源模型,接近海外最领先的模型水平,甚至在部分任务上超越了DeepSeek、阿里、字节等国内企业,以及OpenAI、谷歌和Anthropic等国外企业的最新、最强的开闭源模型。
在与DeepSeek R1的对比中,M1展现出明显的算力成本优势。当生成64K token时,M1消耗的算力不到DeepSeek R1的50%;生成100K token时,这一比例更是降至25%。
MiniMax表示,M1整个强化学习过程仅使用了512块英伟达H800 GPU进行三周训练,租赁成本为53.74万美元(约合380万人民币)。这一成本控制效果“比最初预期少了一个数量级”。


{{item.content}}