模型剪枝的类型有哪些?结构化 vs 非结构化剪枝详解
在深度学习模型部署过程中,模型大小与推理效率的平衡始终是核心挑战。模型剪枝技术通过移除冗余参数,成为解决这一问题的关键手段。根据剪枝粒度与硬件适配性差异,模型剪...
在深度学习模型部署过程中,模型大小与推理效率的平衡始终是核心挑战。模型剪枝技术通过移除冗余参数,成为解决这一问题的关键手段。根据剪枝粒度与硬件适配性差异,模型剪...
Mem0是一款面向AI智能体(AI Agents)的开源通用记忆层工具,旨在为AI助手、客服机器人等应用提供可扩展的长期记忆能力。它通过多级别记忆管理(用户记忆、会话记忆、Agent...
LongCat-Flash-Omni是美团LongCat团队开发的开源全模态大模型,总参数规模达5600亿,基于LongCat-Flash的shortcut-connected混合专家(MoE)架构打造。该模型融合文本、音频...
在人工智能发展史上,窄AI(Narrow AI)已通过图像识别、语音助手等应用深刻改变了人类生活,而通用人工智能(AGI)的终极目标,是构建一个能像人类一样理解世界、自主推理...
Kimi Linear是由Moonshot AI开源的混合线性注意力架构,核心基于Kimi Delta Attention(KDA)机制,通过优化门控机制和混合架构设计,在长上下文任务中实现了内存效率与性能...
FIBO 是 Bria-AI 开发的首个开源、SOTA( state-of-the-art,最先进)JSON 原生文本到图像模型,基于 8B 参数扩散 Transformer(DiT)架构构建,独家使用 100M + 授权长结构...
Univer是一款开源的全栈办公工具框架,支持在Web和服务器端创建、编辑电子表格(Sheet)、文档(Doc)与幻灯片(Slide),具备同构运行、高性能、可扩展、易嵌入的核心优势...
RAG是一种将信息检索与生成式语言模型深度融合的技术框架。其核心逻辑在于通过动态调用外部知识库,为生成模型提供实时、权威的上下文信息,从而弥补大模型在知识时效性、领...
GigaBrain-0 是一款开源的视觉 - 语言 - 动作融合模型,以世界模型为核心技术支撑,能够同时处理视觉输入、语言指令和动作输出,实现智能体对动态环境的实时理解与交互。该...
Kotaemon 是一款开源的检索增强生成(RAG)UI 工具,旨在为终端用户提供简洁的文档对话交互界面,同时为开发者提供可定制的 RAG 管道框架。它支持多模型集成(包括 OpenAI、...
