Kimi Linear:Moonshot AI 推出的开源高效注意力模型架构
Kimi Linear是由Moonshot AI开源的混合线性注意力架构,核心基于Kimi Delta Attention(KDA)机制,通过优化门控机制和混合架构设计,在长上下文任务中实现了内存效率与性能...
Kimi Linear是由Moonshot AI开源的混合线性注意力架构,核心基于Kimi Delta Attention(KDA)机制,通过优化门控机制和混合架构设计,在长上下文任务中实现了内存效率与性能...
Qwen3-VL 是 Qwen 系列开源的强大多模态视觉 - 语言模型,支持图像 / 视频理解、文本交互、视觉代理等全场景任务,具备长上下文处理、空间感知、跨语言 OCR 等核心能力,提...
LiveCC 是一款开源实时视频解说大语言模型(Video LLM),旨在通过融合视频视觉信息与流式语音转录(ASR)文本,实现对视频内容的实时理解与动态解说。该项目提供从数据生产...
MinerU 是由 OpenDataLab 开发的开源多模态大模型工具,专注于解决 PDF 等复杂文档的内容提取难题。它通过创新的两阶段推理架构和原生高分辨率处理能力,在布局分析、表格识...
UserLM-8b是微软研究院开发的开源用户模拟大模型,其核心目标是填补“用户角色模拟”的LLM空白——常规LLM以“助手”身份生成帮助性响应,而UserLM-8b专为模拟“用户”在对...
DeepSeek-V3.2-Exp是DeepSeek-AI推出的实验性大模型版本,作为下一代架构的中间迭代产物,其核心基于DeepSeek-V3.1-Terminus升级,创新引入DeepSeek Sparse Attention(DSA...