HPC-Ops:腾讯混元开源的生产级大模型推理算子库,适配FP8/BF16多精度推理 HPC-Ops是腾讯混元AI团队开源的生产级大模型推理算子库,针对NVIDIA H20 GPU深度优化核心CUDA内核,在Attention、MoE、GEMM等算子上实现顶尖性能。项目集成简单,原生支持B... 6小时前 AI新闻 62