AI训练框架

AI训练框架新闻、工具、教程及资源推荐

BigMac 是小红书内部基础设施团队 Dots-Infra 开源的多模态大模型专用流水并行训练工具套件，基于 Megatron-Core 框架二次开发，采用 MIT 开源协议发布。

FIPO（Future-KL Influenced Policy Optimization）是阿里通义实验室Qwen Pilot团队开源的无价值模型强化学习算法，专为突破大语言模型推理长度瓶颈与提升深度推理能力设计...