混合专家模型

混合专家模型新闻、工具、教程及资源推荐

LongCat-Flash-Prover是美团LongCat团队开源的混合专家（MoE）模型仓库，核心聚焦Lean4编程语言中的原生形式化推理任务，基于56000亿参数的大规模MoE模型与工具集成推理（T...

GLM-4.7-Flash 是由智谱科技开源的轻量化混合专家（MoE）大语言模型，总参数量达 30B，推理时仅激活 3B 参数，实现了高性能与低资源消耗的平衡。该模型支持 200K 长上下文窗...