搜索中心

通义千问开源千亿级参数模型

分享至

4月28日消息,通义千问开源1100亿参数模型Qwen1.5-110B,成为全系列首个千亿级参数开源模型。通义千问1100亿参数模型延续了Qwen1.5系列的Transformer解码器架构,采用了分组查询注意力方法(GQA),使得模型在推理时更加高效。110B模型支持32K上下文长度,具备优秀的多语言能力,支持中、英、法、德、西、俄、日、韩、越、阿拉伯等多种语言。

全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿

分享至

当地时间周四,美国科技巨头Meta推出了其最强大的开源人工智能(AI)模型Llama 3,以追赶行业领导者OpenAI。 Meta首席执行官扎克伯格声称,Llama 3有8B和70B两个版本,大版本的Llama 3将有超过4000亿参数。由于预训练和指令微调,Llama 3相比Llama 2有了极大的改进。

中国电信将于年内开源千亿级参数大模型

分享至

4月16日消息,中国电信开源12B参数规模星辰语义大模型TeleChat-12B,相较1月开源7B版本,内容、性能和应用等方面整体效果提升30%,其中,多轮推理、安全问题等领域提升超40%。另据悉,中国电信将于年内开源千亿级参数大模型。

《人工智能示范法2.0(专家建议稿)》发布,重视AI开源发展、构建知识产权创新规则

分享至

4月16日消息,由中国社会科学院法学研究所、中国互联网协会互联网法治工作委员会主办,南财合规科技研究院、清华大学科技发展与治理研究中心、同济大学上海市人工智能社会治理协同创新中心等承办的“人工智能治理创新论坛”举行。会上,《人工智能法(示范法)》2.0发布。 据悉,《人工智能法(示范法)》2.0在此前版本的基础上不断更新,将基于负面清单实施的人工智能许可管理制度与负面清单外人工智能活动的备案制度明确区分,避免过重合规负担影响人工智能产业的经营预期;重视人工智能开源发展,提出促进开源社区建设、制定专门合规指引、明确责任减免规则等支持措施;构建知识产权创新规则,在研发环节对训练数据、个人信息的使用作出专门安排,并针对人工智能生成物的成果保护与侵权认定进行规定。

李彦宏再给开源大模型泼冷水,称大模型领域开源最贵

分享至

4月16日,百度AI开发者大会上,百度创始人、董事长兼首席执行官李彦宏再次表达了他对大模型开闭源之争的看法。李彦宏表示,因为有了文心4.0基础模型,可以根据需要兼顾效果、响应速度、推理成本等考虑裁减出适合各种场景的小尺寸模型。通过降维裁减出来的模型, 比直接拿开源模型调出来的模型,在同等尺寸下效果更好,在同等效果下成本明显更低。“以前说开源便宜,其实在大模型领域,开源是最贵的。所以开源模型会越来越落后。”李彦宏称。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

分享至

4月7日,阿里云通义千问开源320亿参数模型Qwen1.5-32B。通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数6款大语言模型。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡。目前,通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。

天工大模型3.0将于4月17日正式发布,同步开源4000亿参数MoE超级模型

分享至

昆仑万维宣布天工大模型3.0将于4月17日正式发布。据介绍,天工3.0采用4千亿级参数MoE混合专家模型,并将同步选择开源。天工3.0是全球首个多模态“超级模型”(Super Model),集成了AI搜索、AI写作、AI长文本阅读、AI对话、AI语音合成、AI漫画创作、AI音乐生成等多项能力。其中,AI音乐生成大模型SkyMusic还将于4月2日面向社会开启邀测。

马斯克开源混合专家模型Grok-1

分享至

当地时间3月17日,马斯克的AI创企xAI宣布开源3140亿参数的混合专家模型Grok-1,以及该模型的权重和网络架构。

马斯克宣布本周xAI将开源Grok

分享至

3月11日消息,马斯克今日下午通过推特宣布,自家人工智能公司xAI将在本周内开源人工智能助手Grok。xAI是埃隆·马斯克成立的人工智能公司,于2023年7月12日宣布成立。该公司的目标是专注于回答更深层次的科学问题,希望未来可以利用人工智能帮助人们解决复杂的科学和数学问题,并且“理解”宇宙。据了解,两周后马斯克xAI团队即将发布AI大模型Grok1.5。

李开复AI公司零一万物宣布开源Yi-9B模型

分享至

3月6日,零一万物官微宣布开源Yi-9B模型。据介绍,Yi-9B是目前Yi系列模型中代码和数学能力最强的模型,实际参数为8.8B,默认上下文长度为4K tokens。该公司由李开复带队创办。

地平线正式开源Sparse4D算法

分享至

地平线公司1月22日宣布将纯视觉自动驾驶算法——Sparse4D系列算法开源,目前该算法已在GitHub平台上线。

中国电信星辰语义大模型正式开源

分享至

据华为官微,1月10日,中国电信星辰语义大模型TeleChat-7B版本宣布开源,并开放1T高质量清洗数据集。星辰语义大模型已与昇腾AI基础软硬件完成适配,并开源了适配后的代码。此外,中国电信还将在1月20日开源12B版本模型。

OpenAI公布2024年计划:GPT-5、开源、更强的ChatGPT

分享至

12月25日消息,OpenAI联合创始人兼首席执行官Sam Altman在X平台发布消息,表示AGI(稍晚一些)、GPT-5、更好的语音模型、更高的费率限制;更好的GPTs;更好的推理能力;对唤醒/行为程度的控制;视频模型;个性化;更好地浏览;开源,将是OpenAI在2024年要实现的目标。

我国首个自主研发的地球系统模型宣布开源

分享至

11月17日,第一届地球系统数值模拟科学大会在北京召开。会上,中国科学院大气物理研究所发布了我国首个具有自主知识产权的“完整”地球系统数值模型,并宣布释放其源代码,标志着我国地球系统模式的发展开启协同开发、合作共赢的新范式。这套模型包含完整的气候系统和生态环境系统,集成了大气环流、海洋环流、陆面过程、海冰、气溶胶和大气化学、植被动力学、陆地生物地球化学和海洋生物地球化学等8个分系统模式,通过耦合器来实现地球各圈层间物质、能量的交换。

阿里巴巴即将开源目前国内参数规模最大的大模型

分享至

阿里巴巴集团CEO吴泳铭今日在2023年世界互联网大会乌镇峰会上透露,阿里巴巴即将开源720亿参数大模型,这将是国内参数规模最大的开源大模型。

阿里云通义千问大模型正式向公众开放 近期将开源更大参数规模大模型

分享至

9月13日,阿里云宣布通义千问大模型已首批通过备案,并正式向公众开放,用户可登录通义千问官网(https://qianwen.aliyun.com/)体验,企业用户可以通过阿里云调用通义千问API(https://dashscope.console.aliyun.com/model)。阿里云表示,近期将开源一个更大参数规模的大模型版本,供全社会免费商用。

腾讯云TI平台正式上架 支持Llama 2等行业最新开源模型

分享至

16日开幕的2023中国数字经济创新发展大会上,腾讯高级执行副总裁、云与智慧产业事业群CEO汤道生宣布腾讯云TI平台正式上架。汤道生表示,“腾讯云TI平台支持行业最新、最流行的开源模型,如Llama2、Falcon、Dolly等,可直接部署调用,全程低代码操作。”

浪潮信息自动驾驶计算框架AutoDRRT面向行业开源

分享至

近日,浪潮信息正式发布自动驾驶计算方案AutoDRRT(Autonomous Driving Distributed Robust Real-Time)开源计划,为提升自动驾驶系统的自动分布式并行、高容错、低延时能力提供开源、高效的计算框架。AutoDRRT是全球首个实现自动分布式并行、高容错与低延时的自动驾驶计算框架,将为业界提供免费开放的自动驾驶开发工具模块,自动驾驶应用测试数据集及测试代码,各类自动驾驶场景算法API接口。

IBM与NASA合作共同开源地理空间AI基础模型

分享至

8月4日,据外媒Fagen Wasanni Technologies报道,IBM日前宣布联合NASA,在开源AI平台Hugging Face上,使用IBM的watsonx.ai结合NASA的卫星数据,构建开源地理空间AI基础模型。官方表示,该模型将成为Hugging Face上规模最大的地理空间基础模型,也是与NASA合作建立的首个开源AI基础模型。

阿里云通义千问70亿参数模型开源

分享至

8月3日,阿里云开源通义千问70亿参数模型,包括通用模型Qwen-7B和对话模型Qwen-7B-Chat,两款模型均已上线魔搭社区,开源、免费、可商用。此举让阿里云成为国内首个加入大模型开源行列的大型科技企业。

点击加载更多
泰伯APP
感受不一样的阅读体验
立即打开