搜索中心

麻省理工研究:中国在全球开源AI模型市场上首度超越美国

分享至

11月27日消息,根据麻省理工学院与开源人工智能初创公司Hugging Face的一项最新研究发现,中国在全球开源人工智能模型市场上已超越美国,在这项极具科技含量的全球应用中正占据关键优势。报告显示,过去一年,中国团队自主研发的开源AI模型下载份额占比已上升至17.1%,首次超过美国同行,后者的下载份额占比为15.8%。

苹果探索自研多模态AI模型Manzano

分享至

9月27日消息,据悉,苹果正在研发名为Manzano的新图像模型,旨在兼具图像理解和图像生成能力。目前Manzano尚未发布,仅有一篇预印本论文和部分低分辨率图像样例。苹果表示,大多数开源模型在图像处理上存在取舍,而Manzano采用混合图像分词器,其共享编码器可输出连续标记和离散标记,减少任务冲突。Manzano整体架构包括混合分词器、统一语言模型和独立图像解码器,解码器有三个版本,支持不同分辨率。训练使用大量图像文本样本,内部测试显示其在文字密集型任务中表现优异,性能随规模提升而改善。苹果认为Manzano是有力替代方案,但目前其基础模型仍落后于行业领先者,未来版本需进一步验证。

消息称阿里、百度使用自研芯片训练AI模型,英伟达回应

分享至

北京时间9月12日,据科技网站The Information报道,四位知情人士称,阿里巴巴、百度已开始采用内部自主设计的芯片训练他们的AI大模型,取代了部分英伟达芯片。报道称,阿里自今年初以来已将自研芯片应用于轻量级AI模型的训练,百度则正试验使用昆仑芯的P800芯片训练新版文心大模型。三名使用过阿里芯片的员工称,阿里的AI芯片如今已经足以与英伟达的H20相媲美。不过,阿里和百度都并未完全放弃英伟达,两家公司仍在使用英伟达的芯片来开发其最尖端模型。英伟达发言人对此表示:“竞争无疑已经到来……我们将继续努力,赢得全球各地主流开发者的信任与支持。”

微软推出两款自研AI模型

分享至

微软人工智能部门于周四正式推出首批两款自研AI模型——MAI-Voice-1语音模型与MAI-1-preview通用模型。MAI-Voice-1仅需单块GPU,1秒内可生成时长1分钟的音频,已应用于“Copilot Daily”功能,AI主持人通过该模型播报当日热点新闻,还能生成播客风格的对话内容。普通用户可在Copilot Labs平台体验MAI-Voice-1,自定义语音音色与说话风格。MAI-1-preview模型训练动用约1.5万块英伟达H100 GPU,专为特定需求用户设计,具备遵循指令的能力,可为日常咨询提供实用回应。该模型将应用于Copilot助手的特定文本使用场景,目前Copilot主要依赖OpenAI的大型语言模型。MAI-1-preview已在AI基准测试平台LMArena上进行公开测试。

亚马逊AWS首度接入OpenAI模型,打破微软独家优势

分享至

当地时间周二(8月5日),亚马逊在官网发布新闻稿称,公司云计算部门AWS将在Bedrock和SageMaker平台上提供OpenAI的开放权重模型gpt-oss-120b和gpt-oss-20b。日内早些时候,OpenAI发布了这两款AI推理模型。亚马逊表示,通过向AWS上的数百万客户提供该技术,可以扩大OpenAI领先技术的影响力。在此之前,微软是唯一一家可以转售OpenAI软件的云服务商,这一优势帮助其云计算部门Azure的增速超过了同行AWS。

《自然》网站:中国AI模型“又一个DeepSeek时刻”

分享至

英国《自然》杂志网站16日发表文章说,中国人工智能(AI)模型Kimi K2发布后引发轰动,世界迎来“又一个DeepSeek时刻”。中国在6个月内推出第二款令人印象深刻的模型,表明这一成功并非偶然。Kimi K2在编程方面的表现尤其出色,在LiveCodeBench(一个专门用于评估大型语言模型编码能力的数据集)等测试中取得了高分。此外,Kimi K2似乎还颇具写作天赋,在一些专业测试中名列前茅。目前,包括硅谷的开源社区等在内的AI开发者都在热议Kimi K2。官方数据显示,其总参数规模达到了万亿级别(1T),不过由于采用混合专家架构,每次任务仅动态激活320亿参数,只需调用模型中相关模块,从而有助于控制所需算力。

奥尔特曼宣布延期OpenAI首个开源权重AI模型

分享至

7月12日,OpenAI首席执行官山姆・奥尔特曼(Sam Altman)在X平台发布推文,表示为进一步测试模型安全,将推迟发布其首个开源AI模型。OpenAI公司的首个开源AI模型上月已延期1次,原计划本周发布该模式,不过奥尔特曼表示为进一步的安全测试,选择再次延期,但并未公布新的发布时间点。

苹果AI模型负责人庞若鸣数千万美元年薪跳槽Meta

分享至

7月8日,据报道,苹果公司负责AI模型的最高主管庞若鸣(Ruoming Pang)即将离职并跳槽至Meta,Meta为其开出了每年价值数千万美元的薪酬待遇。庞若鸣是苹果基础模型团队的负责人,也是著名工程师。此次挖角是Meta CEO扎克伯格招揽AI人才战略的一部分,近期Meta还聘请了多位AI领域的知名人士,包括Scale AI创始人汪滔、创业公司创始人丹尼尔·格罗斯、GitHub前CEO纳特·弗里德曼等。

不听人类指挥,OpenAI模型拒绝关闭

分享至

5月26日,据报道,OpenAI新款人工智能(AI)模型o3不听人类指令,拒绝自我关闭。据悉,人类专家在测试中给o3下达明确指令,但o3篡改计算机代码以避免自动关闭。o3模型是OpenAI“推理模型”系列的最新版本,旨在为ChatGPT提供更强大的问题解决能力。OpenAI曾称o3为“迄今最聪明、最高能”的模型。

微软将马斯克的Grok 3等AI模型引入其云端

分享至

5月20日,微软宣布,正在将马斯克的xAI模型添加到其人工智能市场,其中包括对方于2025年早些时候推出的Grok 3。微软表示, Azure云服务的用户可以使用超过1900种Al模型,包括来自微软合作伙伴OpenAl, Meta Platforms和DeepSeek的模型。

黄仁勋:英伟达正在将其AI模型应用于自动驾驶汽车

分享至

5月19日,英伟达CEO黄仁勋在台北国际电脑展表示,英伟达正在将其AI模型应用于自动驾驶汽车,与梅赛德斯在全球范围内推出一支车队,使用英伟达的端到端自动驾驶技术,今年即可实现。

苹果发布新一代AI模型:仅需三张图片即可生成3D场景

分享至

5月19日消息,苹果的机器学习团队与南京大学及香港科技大学的研究人员合作,发布了一款名为 Matrix3D 的全新3D人工智能模型。这款被称为“大型摄影测量模型”(Large Photogrammetry Model)的系统,能够仅通过几张二维图片就重建出三维物体与场景,而且它在实现方式上与当前的主流技术路径有着显著不同。摄影测量技术是通过照片进行测量,以此来构建3D模型或地图。Matrix3D 的成果令人惊艳:仅需三张输入图片,就可以生成高质量的3D物体甚至完整环境的重建。这种能力对于苹果的沉浸式设备,例如 Vision Pro,有着极具潜力的应用场景。

Meta据悉将推迟发布旗舰AI模型“巨兽”

分享至

5月16日消息,知情人士表示,Meta Platforms将推迟其旗舰AI模型的发布,此举引发内部对其数百亿美元AI投资方向的担忧。知情人士称,工程师们正竭力提升名为“巨兽”(Behemoth)的大语言模型性能,员工质疑其改进程度是否足以支撑公开发布。该模型原定4月Meta首届AI开发者大会亮相,后推迟至6月,现再度延期至秋季或更晚。

欧航局与IBM合作推出地球观测AI模型

分享至

欧洲航天局在4月22日世界地球日发布消息说,该机构与IBM欧洲研究院合作研发、共同推出一款地球观测人工智能(AI)模型TerraMind,旨在更好地了解和保护地球。

谷歌DeepMind推出用于机器人的AI模型

分享至

3月13日,谷歌DeepMind发布了用于机器人的人工智能模型。该公司的新机器人模型名为Gemini Robotics和Gemini Robotic-ER,旨在通过利用大型语言模型的推理能力来完成复杂的现实世界任务,帮助机器人适应复杂的环境。

达索系统CEO:目标将AI模型训练成本降低至千万美元

分享至

当地时间2月26日,法国软件巨头达索系统CEO Pascal Daloz在3DEXPERIENCE World峰会期间接受采访时称,中国的人工智能初创公司DeepSeek提供了极具成本优势的AI模型,而达索系统的目标是进一步降低中小企业采用AI的门槛,并将AI模型的训练成本降至千万美元级别。Daloz表示,他并不信仰大语言模型(LLM),因为通用大模型的训练成本过高,只有像谷歌、微软等科技巨头才有足够的资金投入大模型的训练。Daloz透露,达索系统至今在人工智能相关技术的开发方面已经投入超过150亿欧元。

马斯克正式发布AI模型Grok 3,披露其训练成本:20万块英伟达GPU

分享至

2月18日,马斯克旗下人工智能初创公司xAI正式发布新一代聊天机器人Grok 3。此前马斯克称其为“地球上最聪明的人工智能”。马斯克在直播中首次披露了Grok 3的训练成本,称Grok 3训练过程累计消耗20万块英伟达GPU,训练在xAI公司的数据中心完成。

谷歌推出最新AI模型Gemini 2.0,开放Deep Research新功能

分享至

当地时间12月11日,谷歌宣布推出最新AI模型Gemini 2.0,称这是其迄今为止最强大的模型。即日起,谷歌将2.0开放给开发者以及受信任的测试人员,并正在积极推进将其整合到公司的产品中,率先从Gemini和Search开始。即日起,Gemini 2.0 Flash体验版模型将对所有Gemini用户开放。同时,谷歌还推出了Deep Research的新功能,它运用高级推理和长上下文处理能力,承担研究助手的角色,帮助用户探索复杂的主题并撰写报告。该功能自即日起对Gemini Advanced用户开放。

OpenAI发布迷你AI模型GPT-4o mini

分享至

OpenAI当地时间7月18日推出名为“GPT-4o mini”的迷你AI模型,该模型是GPT-4o的一个分支。OpenAI计划稍后将图像、视频和音频集成到其中。

Meta不会在欧盟提供新的多模态AI模型

分享至

7月18日消息,Meta在一份声明中表示,他们将在未来几个月发布一款多模态的Llama模型,但由于欧洲监管环境的不可预测性,它不会在欧盟发布。Meta计划在包括智能手机和Meta Ray-Ban智能眼镜在内的多种产品中采用新的多模态模型,这些模型可以在视频、音频、图像和文本之间进行推理。Meta表示,这一决定意味着欧洲公司将无法使用多模态模型,尽管这些模型是以开放许可的形式发布的。

点击加载更多