GPT-image-2:OpenAI下一代多模态图像模型,精准文本渲染与照片级真实生成
GPT-image-2是OpenAI研发的下一代多模态AI图像生成与编辑模型,深度集成于ChatGPT生态与API服务,主打文本生成图像、图像编辑修复、高精度文本渲染、UI界面生成四大核心能力...
GPT-image-2是OpenAI研发的下一代多模态AI图像生成与编辑模型,深度集成于ChatGPT生态与API服务,主打文本生成图像、图像编辑修复、高精度文本渲染、UI界面生成四大核心能力...
MAI-Image-2-Efficient 是微软于2026年4月正式发布的轻量化、高效率AI文生图模型,属于微软MAI-Image系列的第二代高效版本,定位为旗舰模型MAI-Image-2的低成本、高吞吐替代...
Wan2.7-Image是阿里巴巴达摩院通义实验室(通义万相团队)发布的新一代 AI图像生成与编辑统一模型,该模型彻底打破传统AI生图工具"生成与编辑分离"的架构壁垒,将文生图、图...
MAI-Image-2是微软AI Superintelligence(超智能)团队发布的第二代文本生成图像大型人工智能模型,依托微软前沿多模态深度学习架构迭代优化而成,目前在全球权威AI生图评测...
DramaPixel是由国外团队开发运营的一站式AIGC创意创作平台,核心定位为覆盖图像、视频、音乐三类创意资产的全链路创作工具,无需用户具备专业设计能力,仅通过文字描述即可...
AI Fruit是一个专注于将水果和蔬菜拟人化,并通过人工智能技术生成相关图像与视频的创意内容平台。该平台的核心定位是让用户无需掌握任何专业的动画制作或平面设计技能,即...
Flyne AI是一个集成了全球前沿人工智能生成模型的一站式图像、视频与音乐创作平台。该平台的核心定位是作为“AI创意工厂”,通过统一的交互界面,为用户提供从文本或图像生...
VeoNano是一个整合了谷歌(Google)最新一代生成式人工智能模型的一体化AI视频与图像生成平台。该平台的核心功能是将谷歌DeepMind研发的Veo系列视频生成模型与Nano Banana系...
LoRWeB是NVIDIA研究院发布的开源视觉类比学习框架,核心通过可学习的LoRA权重基底与轻量级编码器动态加权组合,实现“示例驱动”的通用图像编辑。给定图像三元组{a,a'...
ImageCritic是由南开大学HVision实验室推出的开源AI图像后处理项目,基于参考引导的注意力对齐机制,专门解决扩散模型生成图像中常见的细节错位、纹理不匹配、结构不一致等...
BitDance是由字节跳动等机构联合推出的开源自回归生成模型项目,核心解决传统离散自回归模型在视觉生成中令牌器重建质量低、词汇表过大采样困难、逐令牌生成速度慢等痛点,...
DeepGen 1.0是上海创智研究院DeepGen团队发布的轻量级统一多模态开源模型,聚焦于图像生成与编辑核心任务,是一款专为解决大参数量多模态模型训练成本高、部署门槛高、推理...
PopAir是专为macOS系统打造的一款原生AI生产力应用,它将自己定位为“Your really native AI Copilot for MacOS”。其核心目标是将全球顶尖的AI大模型能力无缝集成到macOS的...
ImagineGo.ai是一个一站式AI图像与视频创作平台,它通过聚合全球顶尖的生成式人工智能模型,为用户提供了一个统一、便捷的创作入口。简而言之,它就像是一个“AI模型超市”...
GLM-Image是由智谱AI与华为联合开源的工业级多模态图像生成模型,也是国内首个全程基于国产昇腾算力完成训练的SOTA级图像生成模型。该模型采用“90亿参数自回归生成器+70亿...