VitaBench:美团联合 Sierra Research 推出的 LLM 智能体生活服务场景基准测试框架
VitaBench 是一款由美团与 Sierra Research 联合开发的开源基准测试框架,专为评估大型语言模型(LLM)智能体在真实生活服务场景中的综合能力而设计。该框架通过模拟外卖、...
VitaBench 是一款由美团与 Sierra Research 联合开发的开源基准测试框架,专为评估大型语言模型(LLM)智能体在真实生活服务场景中的综合能力而设计。该框架通过模拟外卖、...
英伟达CUDA凭借20年技术沉淀构建了全球最大的AI开发者生态,AMD ROCm通过开源协议与跨平台兼容性开辟差异化路径,华为CANN则依托自主硬件体系与软硬协同优化实现国产化突围...
Fooocus 作为一款开源、本地化部署的AI图像生成软件,凭借其简洁直观的界面和强大的图像生成能力,迅速在创作者中掀起热潮。它脱胎于Stable Diffusion技术体系,却以“开箱...
DiaMoE-TTS 是由巨人网络联合清华大学开发的开源多方言文本到语音(TTS)框架,该框架基于 F5-TTS 架构扩展,通过统一国际音标(IPA)前端实现跨方言语音表示标准化,结合混...
Kandinsky 5.0是由ai-forever团队开源的扩散模型家族,核心聚焦视频生成(图像生成待上线),已开源的Kandinsky 5.0 T2V Lite(2B参数)在同类开源模型中排名第一,不仅优于...
dInfer 是蚂蚁集团开源的针对扩散语言模型(dLLMs)的高效可扩展推理框架,该框架通过模块化设计将推理流程拆解为模型、扩散迭代管理器、解码策略、KV 缓存管理四大组件,支...
Androidify 是一个由 Google推出的开源示例应用,展示了如何将 Gemini API、Firebase AI Logic SDK、Jetpack Compose、CameraX、Media3 以及 Wear OS 联动等现代 Android 技...
ReplaceAnything 是由阿里巴巴集团智能计算研究所(Institute for Intelligent Computing, Alibaba Group)开发的超高质量内容替换开源项目,核心目标是为用户提供 “所想即...
Ming-UniAudio是一个创新的开源框架,旨在统一语音理解、生成和编辑任务。通过基于VAE框架和因果Transformer架构的统一连续语音tokenizer(MingTok-Audio),它能够有效整合...
Code2Video是由新加坡国立大学Show Lab开发的开源教育视频生成框架,核心以代码驱动实现教育类视频的自动化生成,适用于数学(欧拉公式、傅里叶级数等)、计算机科学(神经...
