字节豆包大模型团队提出稀疏模型架构，推理成本最高可降低83%

2025-02-12 14:42

据豆包大模型团队消息，字节跳动豆包大模型Foundation团队近期提出UltraMem，一种同样将计算和参数解耦的稀疏模型架构，在保证模型效果的前提下解决了推理的访存问题。据介绍，该架构有效解决了MoE推理时高额的访存问题，推理速度较MoE架构提升2-6倍，推理成本最高可降低83%。（36氪）

喜欢您正在阅读的内容吗？欢迎免费订阅泰伯每周精选电邮。立即订阅

声明：泰伯网登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述，文章内容仅供参考。

24小时最热快讯

数据通

2025-12-05 18:53:26

韩国启动国产可重复使用甲烷火箭发动机研发计划
2025-12-05 18:50:25

欧洲通信卫星公司与安哥拉MSTelcom公司合作扩大OneWeb卫星网络服务
2025-12-05 18:17:13

我国成功发射交通VDES卫星A星、B星
2025-12-05 17:54:44

安徽省低空科技发展公司登记成立，注册资本1亿

企业号
换一换

AI时代，时空智能需求爆发式增长！千寻时空服务每月调用量突破万亿次

AI时代，时空智能需求爆发式增长！千寻时空服务每月调用量突破万亿次

视点聚焦|陈元副主席热切关注时空产业，鼓励继续发挥硬科技企业优势

视点聚焦|陈元副主席热切关注时空产业，鼓励继续发挥硬科技企业优势

申报开启 | WIF2025商业航天十年榜单：探寻企业高成长密码

申报开启 | WIF2025商业航天十年榜单：探寻企业高成长密码

大疆发布禅思L3激光雷达，全自研国产化，开启平民化航测新篇章

大疆发布禅思L3激光雷达，全自研国产化，开启平民化航测新篇章