9月26日,阿里通义千问正式发布Qwen3-Omni。据通义千问介绍,Qwen3-Omni是原生全模态大模型,预训练全模态不降智,并在36项音频及音视频基准测试中获32项开源SOTA与22项总体SOTA,超越Gemini-2.5-Pro、Seed-ASR、GPT-4o-Transcribe等闭源强模型。
9月1日,国际权威市场调研机构沙利文(Frost&Sullivan)发布了最新的《中国GenAI市场洞察:企业级大模型调用全景研究,2025》。报告显示,中国企业级大模型调用呈爆发式增长,2025年上半年日均调用量较2024年底实现363%的增长,目前超10万亿 Tokens。其中,阿里通义占比17.7%位列第一,是中国企业选择最多的大模型。
8月22日,记者获悉,阿里通义发布新一代端到端的语音识别大模型Fun-ASR,该模型增强了上下文感知和高精度语音转写能力,在家装、保险等多个行业场景的语音识别准确率均提升了15%以上。目前,Fun-ASR已应用于会议字幕与同传、智能纪要、语音助手等场景,未来该模型将进一步在阿里云百炼上线。
8月19日,通义千问宣布,推出Qwen-Image-Edit,Qwen-Image的图像编辑版本。Qwen-Image-Edit基于20B的Qwen-Image模型进⼀步训练,将Qwen-Image的文本渲染能力延展至图像编辑领域,实现了对图片中文字的精准编辑。
8月7日,阿里通义千问发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。据通义千问介绍,在非推理领域,Qwen3-4B-Instruct-2507全面超越了闭源的GPT4.1-Nano;在推理领域,Qwen3-4B-Thinking-2507甚至可以媲美中等规模的Qwen3-30B-A3B(thinking)。目前新模型已在魔搭社区、HuggingFace正式开源。
7月30日,阿里通义千问宣布Qwen3-30B-A3B模型推出新版本:Qwen3-30B-A3B-Instruct-2507。据介绍,这是一个非思考模式(non-thinking mode)的新模型,长文本理解能力提升至256K,仅激活3B参数,就能取得可媲美Gemini 2.5-Flash(non-thinking)、GPT-4o等闭源模型的性能。
7月27日消息,原通义实验室应用视觉团队负责人薄列峰已加入腾讯混元大模型团队,直接向腾讯副总裁兼混元项目负责人蒋杰汇报。据悉,薄列峰在今年4月30日从阿里离任,彼时曾有传闻称他已加盟某大型互联网企业,在美国任职,并负责多模态模型方向的全面工作,直接向公司高管汇报。薄列峰于2022年加入阿里,起初接棒谭平领导达摩院XR实验室,后调至通义实验室主导应用视觉方向,成为推动阿里图像与视频AIGC技术的重要人物。
6月9日,阿里云宣布比亚迪接入通义大模型。未来,比亚迪智能座舱将通过语音指令实现买票、点单等在线服务。Mobile-Agent采用全视觉解决方案,结合Qwen-VL的视觉识别和推理能力,可智能感知座舱屏幕、规划复杂任务并操作应用UI。比亚迪与阿里云在智能座舱、心理伴聊、营销服务等领域已展开深度合作,包括上线「AI壁纸」和「心理伴聊」功能。
6月6日消息,亚马逊公司正在加速布局人形机器人,并采用DeepSeek、阿里通义千问等开源的大语言模型进行机器人的操控。公开信息显示,亚马逊已在其硬件研发部门Lab126内组建了一支新的 Agentic AI(代理式人工智能)团队,着重推进“物理AI ”的研发工作,希望创造能够根据自然语言指令执行任务的机器人。
北京时间5月29日,英伟达CEO黄仁勋在财报电话会上说,来自中国的DeepSeek和Qwen(阿里通义千问)是开源AI模型之中最好的。免费发布后,它们在美国、欧洲及其他地区获得了巨大关注。最终,赢得AI开发者的平台将赢得AI。出口限制应该加强美国平台,而不是将世界上一半的AI人才推向竞争对手。
近期,日本经济新闻(NIKKEI)提到阿里通义千问大模型已成日本AI开发基础。在日经新闻评测的AI模型综合排名中,通义千问Qwen2.5-Max排名第六,超越了DeepSeek-V3和OpenAI o3-mini等大模型。据了解,日本大量新兴企业正在基于千问开发企业大模型。
英伟达近日开源其代码推理模型(Open Code Reasoning model),包括32B、14B和7B三个参数。该模型以阿里通义千问Qwen2.5-32B、Qwen2.5-14B、Qwen2.5-7B为底座模型。
“互联网八卦小喇叭”等多个微信公众号爆料,阿里巴巴通义实验室应用视觉团队负责人薄列峰(职级P10),已于4月30日低调离职。他曾带领团队做出通义App上全民舞王「兵马俑跳科目三」等爆款功能。知情人士透露,他已经加入某互联网大厂,base美国,担任多模态模型部副总经理,负责部门整体工作,直接向公司副总裁汇报。消息称,该大厂刚刚进行了架构调整。据了解,薄列峰2022年加入阿里,此前担任京东数字科技集团AI实验室首席科学家一职。
去年12月,阿里通义千问推出了QVQ-72B-Preview, 作为一个探索模型,它存在一些不足之处。今天,我们正式推出 QVQ-Max 视觉推理模型的第一版。这一新版本的模型具备强大的多模态处理能力,它不仅能够“看懂”图片和视频里的内容,还能结合这些信息进行分析、推理,甚至给出解决方案。从数学题到生活小问题,从编程代码到艺术创作,QVQ-Max 都表现出了不俗的能力。
3月14日消息,阿里通义实验室语音团队负责人鄢志杰已于近期离职,离职时间为2月15日,按照以前的P序列比照,其职级为P10。鄢志杰2003年大学本科毕业,升入中科大语音实验室攻读博士学位;2008年获得博士学位后,鄢志杰在微软亚洲研究院语音组担任主管研究员。2015年加入阿里巴巴,曾担任阿里IDST智能语音交互团队总监。
3月11日,Manus平台宣布与阿里通义千问团队正式达成战略合作。双方将基于通义千问系列开源模型,致力于在国产模型和算力平台上实现Manus的全部功能。Manus AI方面表示,目前两家技术团队已展开紧密协作,共同致力于为中国用户打造更具创造力的通用智能体产品。
11月18日消息,在今日下午的Rokid Jungle 2024合作伙伴暨新品发布会上,Rokid Glasses AR眼镜新品发布。Rokid Glasses与暴龙眼镜合作,可选多款配色,整体重量仅49g,支持全天佩戴。通过整合阿里巴巴通义千问多模态大模型,Rokid Glasses支持接打电话、AI问答搜索、AI识别物体、AI拍照答题、AI多语种翻译、AI导航、AI转译、AI健康提醒等。从发布会获悉,Rokid Glasses定价2499元,将于2025年第二季度上市开售。
11月13日,据阿里云消息,阿里云通义大模型团队正式开源通义千问代码模型全系列,共6款Qwen2.5-Coder模型。此次开源共推出0.5B/1.5B/3B/7B/14B/32B等6个尺寸的全系列模型,每个尺寸都开源了Base和Instruct模型。其中,Base模型可供开发者微调,Instruct模型则是开箱即用的官方对齐模型。
近日,有媒体报道,阿里通义千问大模型技术负责人周畅低调加入字节跳动。据悉,加入字节的重要大模型人才不止周畅。目前,已有多位AI领域的专家计划加入该研究院。前面壁智能核心成员秦禹嘉和前零一万物核心成员黄文灏已加入字节的大模型团队,汇报给朱文佳。另外,字节还通过收购方式吸揽人才,目前已有多家知名AI创业公司收到字节的收购要约。
9月14日,记者获悉,阿里通义将在云栖大会期间发布视频生成大模型,目前通义App频道和通义万相PC端已上线“视频生成”入口,仅支持用户预约,但未开放使用。页面内容显示,全新发布的视频生成大模型是由通义实验室自主研发,包含“文生视频”和“图生视频”两种创作模式。