分享
Scan me 分享到微信

阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍

9月12日,阿里通义发布下一代基础模型架构Qwen3-Next,并“打样”开源 Qwen3-Next系列模型,总参数80B仅激活 3B ,性能就可媲美千问3旗舰版235B模型,实现模型计算效率的重大突破。基于这一架构创新,Qwen3-Next模型训练成本较密集模型Qwen3-32B大降超90%,长文本推理吞吐量提升10倍以上,为未来大模型的训练和推理的效率设立了全新标准。(潮新闻)
喜欢您正在阅读的内容吗?欢迎免费订阅泰伯每周精选电邮。 立即订阅

24小时最热快讯