AngelSlim:腾讯开源的大模型压缩工具包,一站式量化与推理加速
AngelSlim是腾讯混元AI Infra团队开源的一站式大模型压缩与推理加速工具包,支持LLM、多模态、音频、扩散模型全栈压缩,提供从FP8/INT4到1.25bit的极致量化、Eagle3推测解码...
AngelSlim是腾讯混元AI Infra团队开源的一站式大模型压缩与推理加速工具包,支持LLM、多模态、音频、扩散模型全栈压缩,提供从FP8/INT4到1.25bit的极致量化、Eagle3推测解码...
腾讯开源视频大模型HunyuanVideo(130B参数)从零部署实战:环境配置、HF模型下载、LLaVA/CLIP文本编码器预处理、Gradio服务启动,附避坑清单与性能实测。
12月5日,腾讯混元正式发布最新版语言模型 Tencent HY 2.0 Think 和 Tencent HY 2.0 Instruct。此次升级采用混合专家(MoE)架构,总参数规模达 4060亿(406B),激活参数 ...
HunyuanOCR是腾讯混元开源的端到端OCR专家模型,基于混元原生多模态架构构建,仅1B参数便实现了业界多项SOTA性能。该工具覆盖文字检测识别、复杂文档解析、开放字段信息抽取...