LongCat-Image:美团的开源双语图像生成模型,兼顾中文文本渲染与高效图像编辑
LongCat-Image是美团LongCat团队开源的一款轻量级双语(中英文)图像生成与编辑基础模型,仅6B参数却具备行业领先的性能表现。该模型不仅能实现高质量文本到图像生成,还支...
LongCat-Image是美团LongCat团队开源的一款轻量级双语(中英文)图像生成与编辑基础模型,仅6B参数却具备行业领先的性能表现。该模型不仅能实现高质量文本到图像生成,还支...
NewBie-image-Exp0.1是由NewBieAI-Lab团队开源的一款面向动漫风格的文本到图像生成基础模型,该模型以Next-DiT架构为核心基础,整体参数规模达到3.5B,专门针对二次元动漫图...
HunyuanImage-3.0是腾讯混元团队推出的原生多模态图像生成模型,核心定位是“统一多模态理解与生成的自回归框架工具”。与传统基于DiT的图像生成模型不同,它突破性地采用“...
Step-Audio-R1是阶跃星辰(Stepfun)开源的首款成功解锁测试时计算缩放能力的音频语言模型,核心解决了传统音频模型“反向缩放”的行业痛点,即推理链延长导致性能下降的问题...