Capybara:开源统一视觉创作模型,一站式支持文生图/文生视频/指令级图像视频编辑
Capybara是由xgen-universe团队开源的统一视觉创作模型框架,基于先进扩散模型与Transformer架构,一站式支持文本生成图像(T2I)、文本生成视频(T2V)、指令驱动图像编辑...
Capybara是由xgen-universe团队开源的统一视觉创作模型框架,基于先进扩散模型与Transformer架构,一站式支持文本生成图像(T2I)、文本生成视频(T2V)、指令驱动图像编辑...
阿里巴巴集团通义千问大模型技术负责人、阿里最年轻的P10级技术专家林俊旸,于今日凌晨在社交平台X发文宣布卸任。他仅用一句简短的英文告别:“me stepping down. bye my b...
近日,在美国头部营养追踪应用MyFitnessPal宣布完成对AI卡路里计算应用Cal AI的收购仅两天后,一笔高达3000万美元(约合人民币2亿元)的年收入数据震惊了科技圈。这不仅是一...
本文深度解析OpenClaw引爆的智能体经济浪潮,揭示AI从“聊天工具”向“执行主体”转型的产业趋势。筛选出12个尚未内卷的黄金创业赛道,涵盖智能体支付、边缘硬件、工业维护...
LoRWeB是NVIDIA研究院发布的开源视觉类比学习框架,核心通过可学习的LoRA权重基底与轻量级编码器动态加权组合,实现“示例驱动”的通用图像编辑。给定图像三元组{a,a'...
DreamID-Omni是一款由清华大学与字节跳动联合开源的可控以人为中心的音视频生成框架,其首次将“生成、编辑、动画”三类核心能力无缝整合到单一模型范式中,实现了从“参考...
ImageCritic是由南开大学HVision实验室推出的开源AI图像后处理项目,基于参考引导的注意力对齐机制,专门解决扩散模型生成图像中常见的细节错位、纹理不匹配、结构不一致等...
NullClaw是一款完全采用Zig语言开发的自主AI助手基础设施,以极致轻量化、高性能、零开销、全平台可移植为核心设计目标,编译后仅678KB静态二进制,峰值内存约1MB,启动速度...
OpenSandbox是阿里巴巴开源的面向AI应用场景的通用沙箱平台,提供多语言SDK、统一沙箱协议、Docker/Kubernetes双运行时与开箱即用的沙箱环境,可安全支撑代码执行、命令操作...
DataClaw是由Peter O’Malley推出的开源Python工具,专注于将Claude Code、Codex等AI编码助手的对话历史转化为结构化数据集,支持本地审核、七层隐私脱敏与合规发布至Huggi...