Meta Platforms公司在推动构建比人类更聪明的计算机思维的过程中,一个名为TBD实验室的团队走在了最前沿,该团队拥有许多该公司从竞争对手实验室挖来的研究人员,其中一些人的薪酬高达数千万或数亿美元。据知情人士透露,TBD实验室(to be determined,意为“待定”)正在牵头开发最新版本的大语言模型Llama。上周,负责监督Meta超级智能实验室的首席人工智能官亚历山大.王在给员工的一份备忘录中写道,TBD实验室将与Meta的其他人工智能团队合作开展各种项目,包括即将发布的模型、模型推理能力的扩展和人工智能代理的开发。新的Llama项目由Jack Rae领导,他是从谷歌聘请到TBD实验室的。Meta现有的Llama团队成员和TBD实验室正在合作开发这款产品。该模型还没有正式名称,但在内部被一些人称为Llama4.5和Llama4。
4月5日,Meta公司发布了其公司迄今为止最好的人工智能模型 ——Llama 4。该系列总共有四个新模型:Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。Meta称,所有这些模型都经过了 “大量未标注的文本、图像和视频数据” 的训练,以使它们具备 “广泛的视觉理解能力”。Scout和Maverick模型在Llama.com网站以及Meta的合作伙伴处均可公开获取,而Behemoth模型仍在训练中。Meta表示,其人工智能助手Meta AI已在40个国家更新为使用Llama 4模型。目前,多模态功能仅在美国以英语提供。
3月24日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、APP、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。
华尔街日报1月22日消息,OpenAI首席产品官凯文·维尔(Kevin Weil)表示,OpenAI预计将在2月或3月发布更智能的GPT o3模型。此外,该公司还将在第一季度推出其首批AI智能体工具,使ChatGPT能够在计算机上执行实际操作。维尔举了一个例子,说明ChatGPT可以帮助他的孩子填写并提交足球报名表。Anthropic首席执行官达里奥·阿莫代21日接受采访时预测,在两到三年内,可能就会出现超越人类智能的AI。维尔暗示,这甚至可能在2027年之前就会发生。
7月23日,Meta开源最新Llama 3.1系列,包括4050亿参数 “超大杯”模型。阿里云魔搭社区已上架全系列3款模型,同时,阿里云百炼平台在国内推出针对Llama 3.1系列的训练、部署、推理服务,企业和开发者即日起可在阿里云上基于其打造自己的专属大模型。
Meta当地时间7月23日发布LLAMA 3.1 405B开源人工智能模型。另外,Meta推出Llama模型8B和70B型号的升级版本,将上下文长度扩展至128K,增加了对8种语言的支持。
4月22日,据京东云官方信息,Llama 3 8B 和 Llama 3 70B 模型目前已在言犀AI开发计算平台提供。开发者和企业可以在京东云官网进入言犀AI开发计算平台的“AI资产市场”中选用该模型进行精调及部署。言犀AI开发计算平台此次接入的模型包括Meta-Llama-3-70B-Instruct、Meta-Llama-3-8B-Instruct、Meta-Llama-3-8B三个版本,全部支持部署推理;8B两个版本的模型支持无代码精调实验。
4月19日,高通和Meta宣布合作,以优化Meta Llama 3大语言模型(LLM)直接在智能手机、PC、VR/AR头显和汽车等终端上的执行。开发者将能够访问高通AI Hub中的资源和工具,以实现在骁龙平台上优化运行Llama 3,从而缩短产品上市时间。
当地时间周四,美国科技巨头Meta推出了其最强大的开源人工智能(AI)模型Llama 3,以追赶行业领导者OpenAI。 Meta首席执行官扎克伯格声称,Llama 3有8B和70B两个版本,大版本的Llama 3将有超过4000亿参数。由于预训练和指令微调,Llama 3相比Llama 2有了极大的改进。
1月23日,甲骨文官微宣布推出Oracle云基础设施远程软件服务(Oracle Cloud Infrastructure,OCI)Generative AI服务。据介绍,OCI Generative AI服务是一项全面托管服务,可无缝集成Cohere和Meta Llama 2的大型语言模型(LLM),有效解决各种业务用例。
16日开幕的2023中国数字经济创新发展大会上,腾讯高级执行副总裁、云与智慧产业事业群CEO汤道生宣布腾讯云TI平台正式上架。汤道生表示,“腾讯云TI平台支持行业最新、最流行的开源模型,如Llama2、Falcon、Dolly等,可直接部署调用,全程低代码操作。”
时隔半年后,Meta AI在周二发布了最新一代开源大模型Llama 2。相较于今年2月发布的Llama 1,训练所用的token翻了一倍至2万亿,同时对于使用大模型最重要的上下文长度限制,Llama 2也翻了一倍。Llama 2包含了70亿、130亿和700亿参数的模型。Meta同样在周二宣布,与微软云服务Azure合作,向全球开发者首发基于Llama 2模型的云服务。另外,Meta也与高通宣布,Llama 2将能够在高通芯片上运行,打破市场上英伟达、AMD处理器对AI产业的垄断。