模型量化是什么意思?一文读懂AI模型压缩核心技术
模型量化(Model Quantization)的本质是将神经网络中连续的浮点数值转换为离散的整数表示,通过降低数值精度实现模型压缩与加速。以FP32到INT8的转换为例,每个权重参数的...
模型量化(Model Quantization)的本质是将神经网络中连续的浮点数值转换为离散的整数表示,通过降低数值精度实现模型压缩与加速。以FP32到INT8的转换为例,每个权重参数的...
Astron Agent是科大讯飞开源的企业级、商业友好型智能工作流开发平台,集成AI工作流编排、模型管理、智能RPA自动化、工具生态集成与团队协作能力。可帮助企业快速构建可扩展...
AI-Gamble是一个开源的AI动态互动小说游戏生成器,核心依托大型语言模型(LLM)的强大生成能力,为用户打造“选择决定剧情”的沉浸式阅读体验。简单来说,它不是传统的固定...
MagicAnimate是由新加坡国立大学和字节跳动团队开发的一个基于扩散模型的开源人体图像动画生成框架。简单来说,它的核心功能是:输入一张包含人体的参考图像和一个表示动作...
在人工智能技术深度渗透各领域的今天,AI提示词(Prompt)已成为连接人类需求与AI模型输出的关键桥梁。本文AI铺子精选8款经过验证的AI提示词生成工具,从功能定位、操作逻辑...
Kimi-K2是由Moonshot AI开发的开源代理智能模型,基于混合专家(MoE)架构,总参数达1万亿,激活参数320亿,在15.5万亿token上训练而成。该模型专注于工具使用、复杂推理和...
Step-Audio-EditX是阶跃星辰推出的一款开源音频编辑工具,基于 30 亿参数的大语言模型(LLM)构建,专注于提供富有表现力和迭代式的音频编辑体验。该工具不仅支持普通话、英...
UniWorld-V2 是一款开源的AI图像编辑模型,专注于提升扩散模型的复杂编辑能力。该项目通过创新的 DiffusionNFT 技术和基于预训练多模态大模型(MLLMs)的无训练奖励模型,实...
在深度学习模型部署中,模型大小与推理效率的矛盾始终是核心挑战。模型剪枝技术通过移除冗余参数,成为解决这一问题的关键手段。本文AI铺子将从重要性评估、结构化剪枝、动...
MaxKB是由飞致云(Fit2Cloud)团队开发的开源企业级智能体平台。作为一款专注于知识管理与智能交互的工具,它的核心目标是解决企业在知识沉淀、智能问答、业务流程自动化等...
