搜索-泰伯网

搜索到 15 条相关内容

字节Seed大语言模型团队核心成员乔思远离职，加入Meta

2025-11-19 10:18:45 分享至

11月18日消息，据媒体报道，字节Seed大语言模型团队核心成员乔思远近期离职，加入Meta。乔思远本科毕业于上海交通大学，2021年从约翰·霍普金斯大学博士毕业后加入Google，先后在Google Brain、Google DeepMind团队从事AI研究工作。2025年初，Google DeepMind研究副总裁吴永辉加入字节负责Seed团队，乔思远一同加入字节。此外，Seed视觉模型研究团队核心成员蒋路、田值在今年中离职，其中蒋路加入苹果。蒋路2024年2月加入字节，负责视频生成AI研发，此前是Google VideoPoet的项目研究负责人；田值则是2023年年中加入字节，是AI创业公司光年之外的技术骨干，曾担任字节顶尖AI人才项目TopSeed的导师。知情人士表示，字节依然保持着极高的人才密度。据了解，Seed重点关注的部分研究领域，会鼓励面对复杂问题探索不同的技术方向。

字节人事变动 Meta

海洋大语言模型“瀚海智语”发布

2025-03-24 11:58:46 分享至

3月24日，记者从自然资源部获悉，国家海洋环境预报中心联合海洋出版社有限公司和三六零数字安全科技集团有限公司，以360智脑13B和Deepseek-R1-70B大模型为基座成功开发了海洋垂直领域大语言模型——“瀚海智语”（英文名称OceanDS）。据悉，“瀚海智语”已顺利通过专家评审，于近日正式发布。“瀚海智语”的正式发布，标志着我国在海洋领域人工智能技术应用方面迈出了重要一步，将为海洋行业的智慧化转型提供强有力的技术支撑。

海洋大语言模型瀚海智语

腾讯公布大语言模型训练专利，可提高模型的准确性

2025-02-08 16:03:50 分享至

天眼查App显示，2月7日，腾讯科技（深圳）有限公司申请的“大语言模型的训练方法、装置、计算机设备及存储介质”专利公布。摘要显示，在该方法中，通过在大语言模型的训练过程中引入第一摘要文本和第二摘要文本，为模型训练提供了更多可学习信息，同时由于第一摘要文本和第二摘要文本包含的信息量不同，且第一摘要文本中包含正确语句和错误语句，通过对同一样本文本的两个不同摘要文本进行对比学习，并区分学习第一摘要文本中的正确语句和错误语句，避免了由于摘要文本单一而导致的模型过拟合和生成不准确等问题，不仅提高了模型的泛化性能，还提高了模型的准确性。

腾讯大模型

北京数慧时空取得基于大语言模型的信息处理方法等专利

2024-11-27 11:12:58 分享至

11月25日消息，国家知识产权局信息显示，北京数慧时空信息技术有限公司取得一项名为“基于大语言模型的信息处理方法、装置及电子设备”的专利，授权公告号CN 118779542 B，申请日期为2024年9月。

数慧时空大模型

腾讯混元宣布大语言模型和3D模型正式开源

2024-11-07 10:48:59 分享至

11月5日，腾讯混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“Hunyuan3D-1.0”正式开源，支持企业及开发者精调、部署等不同场景的使用需求，可在HuggingFace、Github等技术社区直接下载，免费可商用。本次开源是腾讯混元继文生图模型后持续开放的一大举措。

腾讯混元大模型

小米大语言模型MiLM正式通过大模型备案

2024-05-16 10:57:05 分享至

5月16日消息，据小米公司官博消息，小米大语言模型MiLM正式通过大模型备案。小米大模型将逐步应用于小米汽车、手机、智能家居等产品中，后续也将面向更多用户开放体验。

小米大模型 MiLM

通义千问开源320亿参数模型，已实现7款大语言模型全开源

2024-04-07 15:44:43 分享至

4月7日，阿里云通义千问开源320亿参数模型Qwen1.5-32B。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数6款大语言模型。此次开源的320亿参数模型，将在性能、效率和内存占用之间实现更理想的平衡。目前，通义千问共开源了7款大语言模型，在海内外开源社区累计下载量突破300万。

通义千问大模型

谷歌被曝出内部AI大语言模型Goose

2024-02-19 11:03:36 分享至

据Business Insider 2月15日报道，泄露的文件显示，谷歌悄悄推出了名为“Goose”的内部AI大语言模型，以帮助员工更快地编写代码，协助开发新产品，提高工作效率。Goose“在谷歌拥有25年的工程专业知识”，仅供谷歌员工使用，“可以回答有关谷歌特定技术的问题，使用内部技术栈编写代码，并支持基于自然语言提示编辑代码等新颖功能”。一份内部文件指出，Goose是“将AI带入产品开发过程的每个阶段”计划的一部分。目前还不清楚它是否功能齐全。

谷歌 AI 模型

昆仑万维发布新版MoE大语言模型“天工2.0”

2024-02-06 11:14:46 分享至

2月6日，昆仑万维正式发布新版MoE大语言模型“天工2.0”与新版“天工AI智能助手”App。据官方介绍，此次更新全面升级了AI搜索、对话、阅读、创作的回答质量与响应速度，支持图文对话、文生图等多模态应用，支持最高100K的超长上下文窗口（超过15万个汉字）。

昆仑万维大语言模型

韩国发布首个大语言模型

2023-11-01 09:52:47 分享至

韩国电信公司 (KT)周二发布了大型AI模型“Mi:dm”，这是韩国企业开发的首个大语言模型(LLM)，已在超过1万亿个token上进行了训练。韩国电信表示，Mi:dm将提供四个版本，从包含约70亿个参数的基础版本到包含约2000亿个参数的大型版本。计划向其他企业开放Mi:dm的基础模式，提供KT Cloud的超大规模人工智能计算服务和人工智能芯片创业公司Rebellions的神经处理单元基础设施等完整的人工智能开发包，促进各种人工智能服务的开发。

大模型

东软集团：东软魔形科技研究院成立，将启动大语言模型系统工程战略

2023-08-10 10:00:03 分享至

8月9日，据东软集团官微消息，东软近日宣布成立东软魔形科技研究院，将启动和实施东软“大语言模型系统工程（LLM Systems Engineering，LLM-SE）”战略，面向医疗、人社、医保、政务、金融、媒体、人力资源及智能汽车等所有业务领域，构建东软LLM-SE+领域应用。

大模型东软集团

苹果悄悄研发AI大语言模型聊天机器人产品已在推进

2023-07-20 10:22:23 分享至

7月20日消息，苹果公司正在悄悄研究可能挑战OpenAI Inc.，谷歌和其他公司的人工智能(AI)工具，但尚未制定出向消费者发布这项技术的明确策略。知情人士透露，苹果建立了自己的框架来创建大语言模型。有了这个被称为“Ajax”的基础后，苹果还创建了一个聊天机器人服务，一些工程师称之为“Apple GPT”。近几个月来，推动AI已成为苹果的一项重大努力，好几个团队在合作这个项目。具体工作包括试图解决与这项技术相关的潜在隐私问题。

苹果 AI 大模型

重庆首个自研大语言模型“兆言”发布

2023-07-14 12:11:01 分享至

据重庆发布微博消息，7月13日，上海交通大学重庆人工智能研究院“兆言”大模型发布会在西部（重庆）科学城召开。发布会上发布该研究院最新研发成果——“兆言”大模型产品，这是重庆首个自主研发的大语言模型，同时，也是该研究院自落地科学城来首次进行的成果发布。“兆言”能够为学术研究、商业分析、生活咨询等用户呈现精准、专业的文本输出。

重庆大模型

百川智能发布130亿参数的通用大语言模型Baichuan-13B系列

2023-07-11 14:10:52 分享至

7月11日，搜狗创始人王小川创立的百川智能正式发布参数量130亿的通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat及其INT4/INT8两个量化版本。据了解，这是百川智能发布的第二款通用大语言模型，6月15日，百川智能推出其首款70亿参数量的中英文语言模型Baichuan-7B。

百川智能大模型

理想汽车负责人：我们在ChatGPT问世之前就已启动AI大语言模型训练

2023-06-19 17:53:47 分享至

理想汽车官方公众号“有个理想”发文介绍了该公司在AI大语言模型领域的发展情况，理想汽车空间算法负责人陈伟表示：“在ChatGPT问世之前，我们就已经启动了整个大语言模型的训练。”陈伟透露：同时，我们也考虑到了多模态数据的需求，包括语音、视觉和文本等多种形式。他还表示，理想汽车的大模型具备拉齐到行业领先水平的四个特点，即“强大的文本生成能力”、“语言理解能力”、“知识问答能力”以及“逻辑推理能力”。

理想汽车 ChatGPT AI

搜索中心