LoRWeB:基于 LoRA 权重基底的视觉类比学习框架,动态组合实现通用图像变换编辑
LoRWeB是NVIDIA研究院发布的开源视觉类比学习框架,核心通过可学习的LoRA权重基底与轻量级编码器动态加权组合,实现“示例驱动”的通用图像编辑。给定图像三元组{a,a'...
LoRWeB是NVIDIA研究院发布的开源视觉类比学习框架,核心通过可学习的LoRA权重基底与轻量级编码器动态加权组合,实现“示例驱动”的通用图像编辑。给定图像三元组{a,a'...
ImageCritic是由南开大学HVision实验室推出的开源AI图像后处理项目,基于参考引导的注意力对齐机制,专门解决扩散模型生成图像中常见的细节错位、纹理不匹配、结构不一致等...
BitDance是由字节跳动等机构联合推出的开源自回归生成模型项目,核心解决传统离散自回归模型在视觉生成中令牌器重建质量低、词汇表过大采样困难、逐令牌生成速度慢等痛点,...
DeepGen 1.0是上海创智研究院DeepGen团队发布的轻量级统一多模态开源模型,聚焦于图像生成与编辑核心任务,是一款专为解决大参数量多模态模型训练成本高、部署门槛高、推理...
PopAir是专为macOS系统打造的一款原生AI生产力应用,它将自己定位为“Your really native AI Copilot for MacOS”。其核心目标是将全球顶尖的AI大模型能力无缝集成到macOS的...
ImagineGo.ai是一个一站式AI图像与视频创作平台,它通过聚合全球顶尖的生成式人工智能模型,为用户提供了一个统一、便捷的创作入口。简而言之,它就像是一个“AI模型超市”...
GLM-Image是由智谱AI与华为联合开源的工业级多模态图像生成模型,也是国内首个全程基于国产昇腾算力完成训练的SOTA级图像生成模型。该模型采用“90亿参数自回归生成器+70亿...
TwinFlow 是一款面向大模型「单步生成(One-step Generation)」的开源项目,核心目标是解决传统扩散模型在图像生成任务中存在的「生成步数多、推理速度慢、资源消耗高」等...
NoteGPT 是一款专为学习者和内容创作者打造的生成式人工智能(Generative AI)工具平台,致力于帮助用户在总结、学习、研究、写作、视觉表达、图像生成与音频创作等多个领域...
Sana是NVIDIA实验室开源的基于线性扩散Transformer技术的高分辨率图像与视频生成项目,该项目支持512px-4Kpx高清图像生成、分钟级视频生成,通过线性化注意力机制、少步扩散...
Aigazou 是一款先进的完全免费、无需注册登录即可使用的AI图像生成工具,致力于为全球用户提供高效、便捷、高质量的图像创作体验。该平台基于最新的生成式人工智能技术(Ge...
Cuty AI 是一个集成了世界领先AI模型的全能内容生成平台,致力于为用户提供从文本到图像、从静态图到动态视频的一站式AI创作解决方案。平台整合了包括 Google Veo、OpenAI ...
LongCat-Image是美团LongCat团队开源的一款轻量级双语(中英文)图像生成与编辑基础模型,仅6B参数却具备行业领先的性能表现。该模型不仅能实现高质量文本到图像生成,还支...
Z-Image Turbo Controlnet Union是阿里通义实验室开源的ControlNet扩展模型,基于Z-Image系列单流扩散架构,6B参数实现 photorealistic 渲染,支持Canny、HED、姿态等多模态...
悠船是由小船创意推出的一款面向企业用户的AI图像生成工具平台,致力于通过先进的生成式人工智能技术,提升企业在视觉设计、内容创作和品牌表达方面的效率与创新能力。其支...