Step3-VL-10B:阶跃星辰开源的10B参数轻量多模态基础模型
STEP3-VL-10B是阶跃星辰(StepFun AI)开源的轻量级多模态基础大模型,核心定位是在10B(100亿)参数的紧凑规模下,实现高效性与前沿多模态智能的极致平衡,打破“参数越大...
STEP3-VL-10B是阶跃星辰(StepFun AI)开源的轻量级多模态基础大模型,核心定位是在10B(100亿)参数的紧凑规模下,实现高效性与前沿多模态智能的极致平衡,打破“参数越大...
LightOnOCR-2-1B 是由 LightOnAI 开源的端到端多语言视觉 - 语言 OCR 模型,仅含 10 亿参数,却实现了当前业界领先的识别性能。该模型打破传统多阶段 OCR 流水线的局限,可...
ChatLab是一款免费开源、本地化部署的聊天记录分析应用,该工具以隐私安全为核心前提,通过流式计算、多线程并行架构实现百万条级聊天记录的高性能处理,同时集成AI Agent与...
Ralph for Claude Code是由frankbria开发并开源的自治式AI开发循环工具,专为Anthropic旗下的Claude Code打造,核心落地了Geoffrey Huntley命名的Ralph技术理念,是一款基于...
AgentCPM是一套面向大语言模型智能体(LLM Agent)研发的开源项目,不同于单一功能的智能体工具,AgentCPM定位为“智能体研发全流程套件”,既包含可直接部署使用的基础智能...
MiniRAG 是由香港大学数据科学学院开发的开源轻量级检索增强生成(RAG)框架,专为资源受限场景下的小型语言模型(SLM)优化设计。该框架通过语义感知异构图索引机制和轻量...
UniVideo是由滑铁卢大学与快手Kling Team联合研发并开源的统一视频AI框架,基于Python语言构建,采用创新的双流架构融合多模态大语言模型(MLLM)与多模态扩散Transformer(...
VoiceSculptor 是由西北工业大学音频语音与语言处理研究组 主导开发并开源的语音智能处理类开源项目,是一款专注于「自然语言可控的语音定制与语音合成」的全链路工具框架,...
OS-Copilot是一款面向Linux、MacOS系统的开源通用智能体框架,核心实现为FRIDAY AI助手,可自动对接操作系统的网页、终端、文件、多媒体及第三方应用等全维度元素,具备自改...
UltraEval-Audio是全球首个开源的音频大模型专属评测框架,聚焦语音理解与语音生成类任务的全维度、标准化评估。该框架聚合34个权威基准数据集,覆盖语音、声音、医疗、音乐...
