8月19日,通义千问宣布,推出Qwen-Image-Edit,Qwen-Image的图像编辑版本。Qwen-Image-Edit基于20B的Qwen-Image模型进⼀步训练,将Qwen-Image的文本渲染能力延展至图像编辑领域,实现了对图片中文字的精准编辑。
7月30日,火山引擎宣布,豆包·图像编辑模型SeedEdit 3.0正式登陆火山方舟。该模型基于文生图模型Seedream 3.0,可支持1K以上高清图像的生成与处理。
5月14日,阿里巴巴正式开源通义万相Wan2.1-VACE。据了解,这是目前业界功能最全的视频生成与编辑模型,单一模型可同时支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等多种生成和编辑能力。该模型拥有1.3B和14B两个版本,其中1.3B版本可在消费级显卡运行。
9月26日消息,国家知识产权局信息显示,北京山维科技股份有限公司申请一项名为“一种地理信息数据的处理方法和装置”的专利,公开号CN 118689951A,申请日期为2024年5月。专利摘要显示,本申请公开了一种地理信息数据的处理方法和装置。包含:获取图幅的数据集,其中包含地物的数据簇和分割线的数据信息;地物的数据簇包含地物的位置信息;分割线的数据信息包含分割线的位置信息;根据地物的位置信息和分割线的位置信息确定被分割的地物;复制被分割的第一地物的在分图幅显示区域之外的至少一部分数据结构至该分割线分割后的分图幅,生成第二地物的数据簇。本申请解决在地理信息系统中读取或编辑分图幅时接边地物不便处理的技术问题。
OpenAI首席技术官Mira Murati日前受访时表示,Sora将于今年晚些时候正式向公众推出,“可能需要几个月”。OpenAI将在Sora中支持配备音效,并允许用户编辑Sora生成的视频内容。此前Sora的测试资格只开放给了视觉艺术家、设计师和电影制作人。