搜索中心

通义千问开源320亿参数模型,已实现7款大语言模型全开源

分享至

4月7日,阿里云通义千问开源320亿参数模型Qwen1.5-32B。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数6款大语言模型。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。

谷歌被曝出内部AI大语言模型Goose

分享至

据Business Insider 2月15日报道,泄露的文件显示,谷歌悄悄推出了名为“Goose”的内部AI大语言模型,以帮助员工更快地编写代码,协助开发新产品,提高工作效率。Goose“在谷歌拥有25年的工程专业知识”,仅供谷歌员工使用,“可以回答有关谷歌特定技术的问题,使用内部技术栈编写代码,并支持基于自然语言提示编辑代码等新颖功能”。一份内部文件指出,Goose是“将AI带入产品开发过程的每个阶段”计划的一部分。目前还不清楚它是否功能齐全。

昆仑万维发布新版MoE大语言模型“天工2.0”

分享至

2月6日,昆仑万维正式发布新版MoE大语言模型“天工2.0”与新版“天工AI智能助手”App。据官方介绍,此次更新全面升级了AI搜索、对话、阅读、创作的回答质量与响应速度,支持图文对话、文生图等多模态应用,支持最高100K的超长上下文窗口(超过15万个汉字)。

韩国发布首个大语言模型

分享至

韩国电信公司 (KT)周二发布了大型AI模型“Mi:dm”,这是韩国企业开发的首个大语言模型(LLM),已在超过1万亿个token上进行了训练。韩国电信表示,Mi:dm将提供四个版本,从包含约70亿个参数的基础版本到包含约2000亿个参数的大型版本。计划向其他企业开放Mi:dm的基础模式,提供KT Cloud的超大规模人工智能计算服务和人工智能芯片创业公司Rebellions的神经处理单元基础设施等完整的人工智能开发包,促进各种人工智能服务的开发。

东软集团:东软魔形科技研究院成立,将启动大语言模型系统工程战略

分享至

8月9日,据东软集团官微消息,东软近日宣布成立东软魔形科技研究院,将启动和实施东软“大语言模型系统工程(LLM Systems Engineering,LLM-SE)”战略,面向医疗、人社、医保、政务、金融、媒体、人力资源及智能汽车等所有业务领域,构建东软LLM-SE+领域应用。

苹果悄悄研发AI大语言模型 聊天机器人产品已在推进

分享至

7月20日消息,苹果公司正在悄悄研究可能挑战OpenAI Inc.,谷歌和其他公司的人工智能(AI)工具,但尚未制定出向消费者发布这项技术的明确策略。知情人士透露,苹果建立了自己的框架来创建大语言模型。有了这个被称为“Ajax”的基础后,苹果还创建了一个聊天机器人服务,一些工程师称之为“Apple GPT”。近几个月来,推动AI已成为苹果的一项重大努力,好几个团队在合作这个项目。具体工作包括试图解决与这项技术相关的潜在隐私问题。

重庆首个自研大语言模型“兆言”发布

分享至

据重庆发布微博消息,7月13日,上海交通大学重庆人工智能研究院“兆言”大模型发布会在西部(重庆)科学城召开。发布会上发布该研究院最新研发成果——“兆言”大模型产品,这是重庆首个自主研发的大语言模型,同时,也是该研究院自落地科学城来首次进行的成果发布。“兆言”能够为学术研究、商业分析、生活咨询等用户呈现精准、专业的文本输出。

百川智能发布130亿参数的通用大语言模型Baichuan-13B系列

分享至

7月11日,搜狗创始人王小川创立的百川智能正式发布参数量130亿的通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat及其INT4/INT8两个量化版本。据了解,这是百川智能发布的第二款通用大语言模型,6月15日,百川智能推出其首款70亿参数量的中英文语言模型Baichuan-7B。

理想汽车负责人:我们在ChatGPT问世之前就已启动AI大语言模型训练

分享至

理想汽车官方公众号“有个理想”发文介绍了该公司在AI大语言模型领域的发展情况,理想汽车空间算法负责人陈伟表示:“在ChatGPT问世之前,我们就已经启动了整个大语言模型的训练。”陈伟透露:同时,我们也考虑到了多模态数据的需求,包括语音、视觉和文本等多种形式。他还表示,理想汽车的大模型具备拉齐到行业领先水平的四个特点,即“强大的文本生成能力”、“语言理解能力”、“知识问答能力”以及“逻辑推理能力”。

泰伯APP
感受不一样的阅读体验
立即打开