11月11日,火山引擎正式发布豆包编程模型(Doubao-Seed-Code):专为Agentic编程任务深度优化,在SWE-Bench-Verified官方榜单中刷新SOTA,并兼容Anthropic API等主流开发环境。同时,此次发布的编程模型价格进一步降低。官方表示,豆包编程模型综合使用成本相比业界平均水平降低62.7%,国内最低价。目前,该模型已通过火山方舟平台全量开放API。面向开发需求量大的个人开发者,并且公布订阅制套餐包“Coding Plan”,“用得多省得多,首月低至9.9元。”官方提到。此外,官方表示,TRAE中国版正式接入豆包编程模型,且TRAE(CN)企业版即日正式公测
11月5日消息,据知情人士透露,字节旗下豆包PC端产品负责人齐俊元已经离职。另据业内人士透露,多家美元基金曾积极接触齐俊元,不仅因为他拥有成功创业的履历,更因为他在豆包产品上的深度经验与对 AI 应用产品化的独特理解。但也有消息表明齐俊元暂时还没有创业打算。
11月3日消息,字节跳动正在试点推进一项“豆包长期激励计划”。该计划为豆包相关大模型业务建立了一套“虚拟股”机制,通过授予豆包股及类似字节期权的回购机制,加强对大模型人才的长期吸引和激励。
10月20日消息,据媒体报道,阿里夸克内部正推进一项代号为“C计划”的AI业务,该计划由夸克核心团队主导,通义实验室也有多位高级别成员参与。多位消息人士透露,该计划与对话式AI应用布局相关,且近日将有首个新成果落地。据消息人士透露,“C计划”已在夸克内部秘密推进了很长一段时间,即将浮出水面的只是阶段性成果。“这是一个需要长期投入,且依赖模型技术突破的产品。”关于“C计划”代号由来,目前有几种猜测。一种说法认为,“C”代表“Chat”,即夸克可能会推出全新的对话形态。另一个更具火药味的内部猜测是,代号“C”取自经典游戏“吃豆人(Pac-Man)”,寓意不言自明,“其目标直指豆包”。截至目前,夸克方面未就上述消息作出相关回应。
9月30日,火山引擎正式发布豆包大模型1.6-vision,这是豆包大模型家族首个具备工具调用能力的视觉深度思考模型,拥有更强的通用多模态理解和推理能力,并支持 Responses API,以更高性价比更好满定客户在视觉理解精准度上的高阶需求。对比上一版视觉理解模型Doubao-1.5-thinking-vision-pro,综合成本降低约50%。
8月26日,据《读佳》报道,字节的豆包内部正在研发测试名为“3D Model Generator”的3D模型生成工具。该工具致力于可控大规模生成模型,为创建高质量3D资产提供有力支持,尤其在游戏中的3D建模领域。该工具或不久后对外开放使用。从测试页面可以看出,“3D Model Generator”支持两种生成方式,一种是基于图像生成,选取本地图像文件,点击“生成”,即可快速生成3D模型,降低了3D建模的入门门槛。另外一种是基于图像+模型生成,通过图像文件与模型文件的结合,实现更复杂或更具针对性的3D资产创作。
8月25日消息,字节跳动豆包大模型视觉基础研究团队负责人冯佳时近期离职。冯佳时2019年加入字节,专注于计算机视觉、机器学习领域的相关研究,曾发表了400多篇关于深度学习、物体识别、生成模型、机器学习理论方面的论文。
特斯拉与字节跳动旗下火山引擎近日达成合作,由火山引擎为特斯拉智能座舱交互体验部分提供大模型服务。根据特斯拉中国官网更新的《特斯拉车机语音助手使用条款》显示,全新上市的特斯拉Model Y L车型将搭载豆包大模型与DeepSeek模型,两款模型均通过火山引擎接入。其中,豆包大模型将承担语音命令功能,如导航设定、媒体播放操控、空调温度调节等,同时还具备车主手册查询功能;DeepSeek模型提供AI语音闲聊服务。
7月30日,火山引擎宣布,豆包·图像编辑模型SeedEdit 3.0正式登陆火山方舟。该模型基于文生图模型Seedream 3.0,可支持1K以上高清图像的生成与处理。
7月29日,此前雷峰网爆料,字节跳动将打造“豆包汽车”。该计划将协同字节跳动旗下火山引擎的汽车云业务,围绕智能汽车的“座舱+智驾”两大板块,提供汽车智能智驾终端解决方案,可视为对标华为鸿蒙智行中软件解决方案的布局。据媒体报道,火山引擎相关负责人对此表示:网传“豆包汽车”纯属谣言。火山引擎为众多汽车客户提供高效的算法训练平台,自身并没有智驾业务计划。
6月11日,字节跳动旗下火山引擎举办FORCE原动力大会。会上,火山引擎发布了豆包大模型1.6,按“输入长度”区间定价,深度思考、多模态能力与基础语言模型统一价格。在企业使用量最大的0-32K输入区间,豆包1.6的输入价格为0.8元/百万tokens、输出8元/百万tokens,综合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。
据知情人士透露,多款由老凤祥与字节旗下火山引擎合作的AI眼镜即将于七月正式发布。作为老凤祥首次跨界AI智能眼镜,其后台由豆包大模型提供技术支持。老凤祥跨界AI眼镜产品,将支持视觉理解、语音对话、语义识别、电话接听等功能,主要面向老年人群体。
近期字节AI产品部门Flow旗下发生产品调整:社交陪伴类AI产品猫箱原负责人梁琛奇已离开字节跳动;猫箱负责人由原星绘产品负责人西原(花名)接任;同时,星绘团队计划并入豆包,将由豆包App端负责人陆游(花名)一起管理。
2月25日消息,字节跳动旗下AI助手豆包正在小范围测试深度思考模型,但接入的不是DeepSeek模型。据豆包相关负责人表示,当前测试的是自己深度思考模型的不同实验版本。实测发现,在豆包对话页面暂未显示“深度思考”功能的入口,但被灰度到的用户在询问不同问题后,豆包生成的答复中会显示思维链。
据豆包大模型团队消息,字节跳动豆包大模型Foundation团队近期提出UltraMem,一种同样将计算和参数解耦的稀疏模型架构,在保证模型效果的前提下解决了推理的访存问题。据介绍,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2-6倍,推理成本最高可降低83%。
2月8日消息,记者从智己汽车内部获悉,其智能座舱已深度引入DeepSeek大模型,并与豆包、通义等大模型合作,通过深度联合训练,构建多场景插拔式AI矩阵平台。
1月22日,豆包大模型1.5Pro版本正式发布。团队称模型训练过程中未使用任何其他模型生成的数据。目前,Doubao-1.5-pro已在豆包APP灰度上线,开发者也可在火山引擎直接调用API。
豆包实时语音大模型于1月20日正式推出,并在豆包App全量开放,将豆包App升级至7.2.0版本即可体验。据介绍,豆包实时语音大模型,是一款语音理解和生成一体化的模型,实现了端到端语音对话。相比传统级联模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性。
12月10日消息,字节跳动视频生成模型PixelDance已在豆包电脑版正式开启内测,部分用户已开通体验入口。内测页面显示,用户每日可免费生成十支视频。
9月24日,在2024火山引擎AI创新巡展上,火山引擎总裁谭待宣布推出豆包.视频生成模型。据他介绍,豆包.视频生成模型具有高效的DIT融合计算单元,能更充分地压缩编码视频与文本;还使用了全新设计的扩散模型训练方法,保证了多镜头生成的一致性;该模型还使用了深度优化的Transformer结构,大幅提升了视频生成的泛化能力。