QuantiPhy:开源视觉-语言模型定量物理推理评估基准,精准衡量AI运动学推理能力 QuantiPhy是首个专注于评估视觉-语言模型(VLMs)定量运动学推理能力的开源评估基准及配套代码库,该项目通过多区域准确率(MRA)核心指标,从难度等级、任务类别等维度衡量... 2个月前 AI新闻 75