PawBench:阿里通义开源的全链路AI智能体自动化评测基准 PawBench是通义实验室AgentScope团队开源的全链路AI智能体评测基准,采用模型+框架+任务三维评测体系,内置海量标准化测试用例,支持多主流大模型与智能体框架接入,具备自... 5小时前 AI新闻 68