ClawWork:港大开源的AI智能体经济生存与职业能力评估平台 ClawWork是由香港大学数据科学实验室(HKUDS) 研发并开源的AI智能体经济生存与职业能力基准测试平台,核心定位是把传统AI助手从“辅助工具”升级为能完成真实专业工作、创... 3周前 AI新闻 150
OpenJudge:开源AI应用评估与优化框架 OpenJudge是一款专为AI应用设计的开源评估框架,基于Python开发,核心定位是为AI智能体、聊天机器人、多模态应用、代码生成系统等各类AI应用提供标准化、自动化、全维度的质... 1个月前 AI新闻 99