OpenBench:开源大模型评估工具,支持多平台基准测试 OpenBench 是由 Groq 团队开发的开源大模型评估工具,旨在为研究人员和开发者提供一个与模型提供商无关的基准测试平台。它支持 35+ 评估套件和 30+ 模型提供商,涵盖知识、... 1个月前 AI新闻 29