Z-Image Turbo Controlnet Union:阿里开源多条件控制 ControlNet 模型,低显存高效支持精准图像生成与编辑
Z-Image Turbo Controlnet Union是阿里通义实验室开源的ControlNet扩展模型,基于Z-Image系列单流扩散架构,6B参数实现 photorealistic 渲染,支持Canny、HED、姿态等多模态...
Z-Image Turbo Controlnet Union是阿里通义实验室开源的ControlNet扩展模型,基于Z-Image系列单流扩散架构,6B参数实现 photorealistic 渲染,支持Canny、HED、姿态等多模态...
Stand-In是微信CV团队开源的一款轻量级、即插即用的视频生成身份控制框架,核心优势在于仅需训练基础视频生成模型1%的额外参数,就能在人脸相似度和自然度上达到行业领先水...
MobiAgent是一款开源的可定制移动智能体系统,该框架核心包含MobiMind代理模型家族、AgentRR加速框架与MobiFlow评测基准三大模块,支持通过ADB连接Android设备,实现跨应用...
ValueCell是一个基于开源协作模式构建的多智能体(Multi-Agent)金融应用工具,,核心定位为去中心化金融代理协作生态,旨在为用户提供股票/加密货币的选股、研究、跟踪及智...
近日,OpenAI 旗下广受欢迎的人工智能聊天机器人 ChatGPT 遭遇服务故障问题,在 12 月 2 日和 3 日接连出现服务中断情况,致使部分用户无法正常使用该服务,引发广泛关注。...
HunyuanImage-3.0是腾讯混元团队推出的原生多模态图像生成模型,核心定位是“统一多模态理解与生成的自回归框架工具”。与传统基于DiT的图像生成模型不同,它突破性地采用“...
GELab-Zero是由阶跃星辰开源的GUI智能体解决方案,整合了工程化基础设施与4B轻量模型,主打本地部署、一键启动和多设备任务自动化能力。该项目针对移动生态碎片化带来的工程...
Vidi2是字节跳动智能创作与编辑团队研发的开源大型多模态视频理解与生成模型,作为初代Vidi的迭代升级版本,新增细粒度时空定位(STG)和视频问答(Video QA)核心能力,可...
12月1日,拍我AI(PixVerse)正式推出V5.5版本,国内首次应用Diffusion与Transformer混合架构,将视频生成速度与质量同步提升。该版本实现了毫秒级音画对口型同步,标志着A...
可灵AI公司今日正式宣布,其自主研发的全球首个统一多模态视频大模型O1于零时起面向公众全量开放。该模型凭借MVL(多模态视觉语言)统一交互架构与Chain-of-Thought推理链路...