VitaBench:美团联合 Sierra Research 推出的 LLM 智能体生活服务场景基准测试框架 VitaBench 是一款由美团与 Sierra Research 联合开发的开源基准测试框架,专为评估大型语言模型(LLM)智能体在真实生活服务场景中的综合能力而设计。该框架通过模拟外卖、... 2天前 AI新闻 7