PawBench:阿里通义开源的全链路AI智能体自动化评测基准
PawBench是通义实验室AgentScope团队开源的全链路AI智能体评测基准,采用模型+框架+任务三维评测体系,内置海量标准化测试用例,支持多主流大模型与智能体框架接入,具备自...
PawBench是通义实验室AgentScope团队开源的全链路AI智能体评测基准,采用模型+框架+任务三维评测体系,内置海量标准化测试用例,支持多主流大模型与智能体框架接入,具备自...
Hermes Desktop 是由海外AI研发团队 Nous Research 基于自研 Hermes-Agent 大模型智能体内核开发的开源跨平台桌面端AI智能体客户端,原生适配 Windows10/11、macOS 12及以上...
Science Skills是Google DeepMind开源的全学科科研专用技能工具库,统一封装生物、化学、文献检索等数十类科研数据源接口,兼容GPT、Gemini、通义千问等主流大模型工具调用...
MiniMax M3是国内AI企业稀宇科技(MiniMax)发布的旗舰级混合专家大模型,也是全球首款同时集齐前沿编程能力、100万Token超长上下文、原生全模态三大Frontier核心能力的国产...
Qwen‑VLA是阿里通义千问推出的开源通用视觉‑语言‑动作统一具身智能模型,基于Qwen多模态基座构建,通过四阶段训练实现视觉感知、语言理解与连续动作生成的端到端融合,单...
Dynamic Workflows是Anthropic集成于Claude Code的企业级AI多智能体动态编排引擎,专为复杂工程任务设计,具备运行时动态任务拆解、大规模并行子智能体调度、断点续跑与对抗...
PilotDeck是清华THUNLP、面壁智能等联合研发的开源AI Agent操作系统,以WorkSpace为核心实现文件、记忆、技能全隔离,具备白盒可追溯记忆、智能路由降本70%、Always-on后台...
DataBuddy 是腾讯云 WeData 平台推出的大数据原生智能体(Agent)工作台,是腾讯 Buddy 家族继 CodeBuddy、WorkBuddy 后的第三位核心成员,基于腾讯 WorkBuddy 同源 Agent ...
Keye-VL-2.0-30B-A3B是快手开源的30B级旗舰多模态大模型,采用DSA稀疏注意力架构,支持256K超长上下文无损推理,长视频理解性能领先同级别模型;原生集成Code/Tool/Search全...
Uni-Agent是verl-project推出的一体化通用AI智能体开源框架,采用三层解耦架构,支持千级并发任务运行,集成推理执行、可视化监控、强化学习训练功能,可快速搭建办公、代码...
