AI模型评测

QuantiPhy是首个专注于评估视觉-语言模型（VLMs）定量运动学推理能力的开源评估基准及配套代码库，该项目通过多区域准确率（MRA）核心指标，从难度等级、任务类别等维度衡量...

6个月前 AI新闻

145

AI模型评测新闻、工具、教程及资源推荐