阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍
2025-09-12 10:55
9月12日,阿里通义发布下一代基础模型架构Qwen3-Next,并“打样”开源 Qwen3-Next系列模型,总参数80B仅激活 3B ,性能就可媲美千问3旗舰版235B模型,实现模型计算效率的重大突破。基于这一架构创新,Qwen3-Next模型训练成本较密集模型Qwen3-32B大降超90%,长文本推理吞吐量提升10倍以上,为未来大模型的训练和推理的效率设立了全新标准。(潮新闻)
喜欢您正在阅读的内容吗?欢迎免费订阅泰伯每周精选电邮。
立即订阅
声明:泰伯网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考。