AngelSlim:腾讯开源的大模型压缩工具包,一站式量化与推理加速 AngelSlim是腾讯混元AI Infra团队开源的一站式大模型压缩与推理加速工具包,支持LLM、多模态、音频、扩散模型全栈压缩,提供从FP8/INT4到1.25bit的极致量化、Eagle3推测解码... 4小时前 AI新闻 67