dInfer:蚂蚁集团推出的扩散语言模型专用高性能推理框架
dInfer 是蚂蚁集团开源的针对扩散语言模型(dLLMs)的高效可扩展推理框架,该框架通过模块化设计将推理流程拆解为模型、扩散迭代管理器、解码策略、KV 缓存管理四大组件,支...
dInfer 是蚂蚁集团开源的针对扩散语言模型(dLLMs)的高效可扩展推理框架,该框架通过模块化设计将推理流程拆解为模型、扩散迭代管理器、解码策略、KV 缓存管理四大组件,支...
Androidify 是一个由 Google推出的开源示例应用,展示了如何将 Gemini API、Firebase AI Logic SDK、Jetpack Compose、CameraX、Media3 以及 Wear OS 联动等现代 Android 技...
ReplaceAnything 是由阿里巴巴集团智能计算研究所(Institute for Intelligent Computing, Alibaba Group)开发的超高质量内容替换开源项目,核心目标是为用户提供 “所想即...
Ming-UniAudio是一个创新的开源框架,旨在统一语音理解、生成和编辑任务。通过基于VAE框架和因果Transformer架构的统一连续语音tokenizer(MingTok-Audio),它能够有效整合...
Code2Video是由新加坡国立大学Show Lab开发的开源教育视频生成框架,核心以代码驱动实现教育类视频的自动化生成,适用于数学(欧拉公式、傅里叶级数等)、计算机科学(神经...
AI_NovelGenerator 是一款基于大语言模型(LLM)的开源长篇小说创作辅助工具,旨在帮助作者高效生成情节连贯、设定统一的小说内容。该工具集成了小说设定工坊、智能章节生成...
AIMangaStudio 是一个基于 AI 技术的漫画制作工具,旨在帮助创作者快速生成漫画脚本、设计角色、布局分镜,并最终导出完整的漫画作品。本项目集成了 Google GenAI 等先进 A...
EchoCare 是一个面向超声临床应用的完全开源基础模型,基于大规模无标注超声影像数据集 EchoAtlas 训练而成。该数据集覆盖全球 5 大洲 23 个临床中心、38 种不同超声设备,...
RoboBrain-X0 是一个突破性的跨实体机器人智能框架,旨在克服单机器人系统在异构实体迁移中的局限性。它通过统一的动作词汇表和先进的动作令牌化技术,实现了在不同机器人平...
Lynx是字节跳动Intelligent Creation团队开发的开源高保真个性化视频生成模型,基于Diffusion Transformer(DiT)架构,通过ID-adapter(身份保留)和Ref-adapter(空间细节...
