9月30日,火山引擎正式发布豆包大模型1.6-vision,这是豆包大模型家族首个具备工具调用能力的视觉深度思考模型,拥有更强的通用多模态理解和推理能力,并支持 Responses API,以更高性价比更好满定客户在视觉理解精准度上的高阶需求。对比上一版视觉理解模型Doubao-1.5-thinking-vision-pro,综合成本降低约50%。
特斯拉与字节跳动旗下火山引擎近日达成合作,由火山引擎为特斯拉智能座舱交互体验部分提供大模型服务。根据特斯拉中国官网更新的《特斯拉车机语音助手使用条款》显示,全新上市的特斯拉Model Y L车型将搭载豆包大模型与DeepSeek模型,两款模型均通过火山引擎接入。其中,豆包大模型将承担语音命令功能,如导航设定、媒体播放操控、空调温度调节等,同时还具备车主手册查询功能;DeepSeek模型提供AI语音闲聊服务。
6月11日,字节跳动旗下火山引擎举办FORCE原动力大会。会上,火山引擎发布了豆包大模型1.6,按“输入长度”区间定价,深度思考、多模态能力与基础语言模型统一价格。在企业使用量最大的0-32K输入区间,豆包1.6的输入价格为0.8元/百万tokens、输出8元/百万tokens,综合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。
据豆包大模型团队消息,字节跳动豆包大模型Foundation团队近期提出UltraMem,一种同样将计算和参数解耦的稀疏模型架构,在保证模型效果的前提下解决了推理的访存问题。据介绍,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2-6倍,推理成本最高可降低83%。
1月22日,豆包大模型1.5Pro版本正式发布。团队称模型训练过程中未使用任何其他模型生成的数据。目前,Doubao-1.5-pro已在豆包APP灰度上线,开发者也可在火山引擎直接调用API。