WBench:美团联合复旦开源的AI视频交互能力标准化评测基准 WBench是美团LongCat团队联合复旦大学开源的交互式视频世界模型专项评测基准,内置海量标准化测试案例与22项自动化评估指标,支持多轮交互、双视角与多种控制范式,可全方位... 6小时前 AI新闻 64