搜索中心

谷歌发布新一代图像生成模型Nano Banana Pro

分享至

11月21日消息,谷歌正式推出全新图像生成与编辑模型 Nano Banana Pro (Gemini 3 Pro Image)。该模型基于 Gemini 3 Pro 架构构建,号称能以“前所未有的控制力、完美的文字渲染效果以及增强的世界知识储备”,将用户的构想转化为“工作室级(studio-quality)”的设计作品。即日起,Nano Banana Pro 面向全球用户开放免费试用。用户只需登录 Gemini 应用,选择“生成图像(Create image)”功能,并切换至“Thinking”模式即可体验这一最新模型。

美航天局公布“星际访客”彗星最新图像

分享至

美国航天局19日公布了由其探测器和空间望远镜拍摄的“星际访客”——彗星3I/ATLAS的一批最新图像。这颗彗星预计将于12月19日前后飞掠地球,届时它与地球的最近距离约2.7亿公里,约为地日距离的两倍。

微软发布图像生成模型MAI-Image-1

分享至

10月14日,微软发布自研AI文生图模型MAI-Image-1。微软表示,MAI-Image-1 “擅长”闪电、风景等逼真的图像,它可以比“更大、更慢的模型”更快地处理请求并生成图像。该模型已经跻身人工智能基准网站LMArena同类模型的前10名。

腾讯发布并开源新一代生图模型“混元图像3.0”

分享至

9月28日,腾讯混元发布并开源原生多模态生图模型“混元图像3.0(HunyuanImage 3.0)”。据腾讯官方介绍,这是首个工业级原生多模态生图模型,参数规模80B,也是目前测评效果最好、参数量最大的开源生图模型,效果可对标业界头部闭源模型。

腾讯混元发布原生多模态图像生成模型

分享至

9月9日晚间,腾讯混元最新的生图模型“混元图像2.1(HunyuanImage 2.1)”正式发布,支持最长达1000个tokens的提示词,支持原生2K生图。此外,腾讯混元方面透露,“混元原生多模态图像生成模型,也在路上了。”本次,混元还开源中英文改写模型——混元文本改写模型(PromptEnhancer),能够对用户的文本指令进行结构化优化。

谷歌宣布向所有用户开放图像处理程序,Adobe紧急回应

分享至

谷歌于周二宣布,Google Deepmind开发了该模型并将其集成至Gemini应用及网站,使其向所有用户开放。这款最初以“Nano Banana”为代号进行测试的模型,如今被正式命名为Gemini 2.5 Flash。这可能对现有图像处理程序构成重大威胁,尤其是Adobe旗下的Photoshop等产品。Adobe于周二紧急回应,宣布将立即在Adobe Firefly和Adobe Express中集成谷歌新模型。针对“用户为何不直接使用谷歌而选择Adobe工具”的疑问,Adobe强调其优势在于提供一站式模型集成服务。

谷歌正式发布图像生成模型Gemini 2.5 Flash Image

分享至

当地时间8月26日,谷歌正式推出了其最先进的图像生成与编辑模型Gemini 2.5 Flash Image,代号“纳米香蕉”(nano banana)。该模型当前在LMArena基准测试中位列AI图像编辑模型榜首,具备角色一致性保持、自然语言精准修图、多图融合能力,并利用Gemini世界知识提升智能表现。目前用户可通过Gemini App、API等方式访问,其API定价为每百万输出token30美元。

阿里通义千问:推出图像编辑模型Qwen-Image-Edit

分享至

8月19日,通义千问宣布,推出Qwen-Image-Edit,Qwen-Image的图像编辑版本。Qwen-Image-Edit基于20B的Qwen-Image模型进⼀步训练,将Qwen-Image的文本渲染能力延展至图像编辑领域,实现了对图片中文字的精准编辑。

豆包图像编辑模型3.0上线火山方舟

分享至

7月30日,火山引擎宣布,豆包·图像编辑模型SeedEdit 3.0正式登陆火山方舟。该模型基于文生图模型Seedream 3.0,可支持1K以上高清图像的生成与处理。

腾讯混元发布图像生成2.0模型

分享至

5月16日,腾讯发布最新混元图像2.0模型(Hunyuan Image2.0)。腾讯混元表示,相比前代模型,腾讯混元图像2.0模型参数量提升了一个数量级,可实现毫秒级响应,支持用户可以一边打字或者一边说话一边出图。新模型图像生成质量提升明显,可有效避免AIGC图像中的“AI味”模型于即日起在腾讯混元官方网站上线,并对外开放注册体验。

中国自研AI图像生成模型HiDream-I1与HiDream-E1官宣全面开源

分享至

4月15日,HiDream智象未来团队宣布正式开源图像生成大模型HiDream-I1与交互编辑模型HiDream-E1。HiDream-I1在权威榜单Artificial Analysis中24小时内登顶,成为首个跻身全球第一梯队的中国自研生成式AI模型,并在图像质量、语义理解、艺术表现三大维度刷新行业纪录,实现图像的多风格生成,涵盖动漫、肖像、科幻等场景。目前,设计工具Recraft已集成HiDream模型,用户3步即可实现“一键出图+智能编辑”。

智象未来的图像生成大模型HiDream-I1登顶图像生成模型榜首

分享至

4月11日,独立AI基准测试与分析平台Artificial Analysis最新竞技场榜单揭晓,智象未来的图像生成大模型HiDream-I1开源仅24小时就登顶图像生成模型榜首,成为首个登顶该榜单的中国自研生成式AI模型。据介绍,HiDream-I1已参与 5000 余次测评,覆盖“文字排版”“人物肖像”“动漫”“科幻题材” 等多个关键细分领域。

OpenAI推出GPT-4o图像生成功能

分享至

当地时间3月25日,美国开放人工智能研究中心(OpenAI)宣布推出4o图像生成功能,“将迄今最先进的图像生成器集成至GPT-4o”。即日起,所有Plus、Pro、Team及免费用户将陆续在ChatGPT和Sora中体验该功能,企业版与教育版即将接入,Sora平台同步启用。开发者即将通过API调用GPT-4o图像生成功能,接口权限将于未来数周内开放。据介绍,GPT-4o图像生成功能可精准文本渲染、严格遵循指令提示、深度调用4o知识库及对话上下文——包括对上传图像进行二次创作或将其转化为视觉灵感。

AI图像生成平台「LiblibAI」获数亿元融资,顺为资本领投

分享至

据顺为资本公众号消息,近日,AI图像生成平台「LiblibAI-哩布哩布AI」宣布,该公司在短短一年内连续完成四轮融资。继2024年7月披露的数亿元融资后,又成功斩获数亿元资金,创下国内 AI 应用赛道融资速度纪录。据悉,最新两轮融资由顺为资本、渶策资本领投,明势创投等老股东超额跟投,巨人网络担任本轮产业投资方。本轮融资将重点投入创作者生态建设与技术研发,加速构建AI时代的创意基础设施。进一步提升平台的技术实力和用户体验。

日企最快2026年发射传输图像的地球同步卫星

分享至

日本NTT和“SKY Perfect JSAT”的合资公司“Space Compass”(东京)最快将于2026年,向亚洲上空发射用来传输多颗地球观测卫星所拍摄图像数据至地面的地球同步卫星。一旦投入使用,能几乎实时获取以日本为中心的大范围卫星图像。这有助于强化海上监视,预计防卫省和航运公司会加以利用。

测绘股份申请基于高维图像特征向量的大型地下空间导航专利,能够进行大型地下空间高效实时导航

分享至

12月10日消息,国家知识产权局信息显示,南京市测绘勘察研究院股份有限公司申请一项名为“基于高维图像特征向量的大型地下空间导航方法、系统、设备和介质”的专利,公开号 CN 119091169 A,申请日期为2024年9月。 专利摘要显示,本发明公开一种基于高维图像特征向量的大型地下空间导航方法、系统、设备和介质,方法包括:在地下空间内采集高维图像;采用深度学习算法提取高维图像中的关键特征,得到高维图像特征向量;将高维图像特征向量与对应的空间位置信息关联,构建高维图像特征向量库;实时拍摄用户自身当前位置的图像,将拍摄的图像与高维图像特征向量库中的特征向量进行匹配,定位用户当前位置;根据用户当前位置与目的地位置,在高维图像特征向量库中进行路径搜索,利用路径规划算法计算最优导航路径;在导航过程中,实时更新当前位置,根据需要调整路径规划。能够进行大型地下空间(如地铁系统地下停车场地下综合体等)高效实时导航。

“AI教母”李飞飞创业公司公布“空间智能”成果:单张图像生成三维世界

分享至

由华裔科学家、被称为“AI教母”的斯坦福大学教授李飞飞创办的AI创业公司World Labs于12月2日宣布向“空间智能”迈出第一步:从单张图像即可生成三维世界。这一人工智能系统可以让用户“进入任何图像,并以三维方式进行探索”。

25厘米分辨率彩色SAR卫星图像发布

分享至

ICEYE于2023年5月首次推出Dwell模式,随后于2024年3月推出Dwell Fine。Dwell Precision是业界最高保真度的25厘米成像产品,于2024年10月发布。Dwell Precise将高质量数据与高分辨率相结合。其1200 MHz雷达带宽决定了独特的25cm分辨率。与一般单极化SAR黑白图像不同,该模式可以提供彩色显示,可以识别较小的物体或目标,例如车辆类型和军事装备,而无需额外的情报来源。Dwell模式可提供非常不错的信息密度和高度减少的散斑,这意味着图像中的每个细节都显得非常清晰。这张荷兰鹿特丹的“Dwell Precise”模式图像是单个图像中提供大量细节的一个例子。

机构:预测2024年全球3D图像传感器出货规模约4.7亿颗,同比增长约9.6%

分享至

市场调研机构群智咨询(Sigmaintell)报告显示,2023年全球3D图像传感器出货规模约4.3亿颗,2024年出货预计增长至4.7亿颗,同比增长9.6%。预计未来5年将维持约6%以上复合增长率,预估2029年其营收规模近48亿美金。

点击加载更多