Ring-V2.5:蚂蚁集团开源的万亿参数AI思考模型,高效推理与长程任务执行双突破
Ring-V2.5是蚂蚁集团开源的全球首个基于混合线性注意力架构的万亿参数思考模型专属仓库,核心承载Ring-2.5-1T模型的开源发布、技术说明、部署教程与示例演示。该模型突破传...
Ring-V2.5是蚂蚁集团开源的全球首个基于混合线性注意力架构的万亿参数思考模型专属仓库,核心承载Ring-2.5-1T模型的开源发布、技术说明、部署教程与示例演示。该模型突破传...
JoyAI-LLM-Flash是京东开源的一款达到行业先进水平的中型指令大语言模型,核心采用混合专家(Mixture-of-Experts,MoE)稀疏架构设计,打造了480亿总参数、30亿激活参数的参...
Ming-omni-tts是inclusionAI开源的高性能端到端统一音频生成模型,依托自研12.5Hz连续音频Tokenizer与Patch-by-Patch压缩策略,实现语音、音乐、环境音效单通道联合生成,支...
HY-1.8B-2Bit是腾讯AngelSlim团队基于混元Hunyuan-1.8B-Instruct打造的开源2Bit产业级端侧大语言模型,该模型通过量化感知训练(QAT)实现极致压缩,等效参数量0.3B、内存占...
Helcyon-Mercury-12B-v3.0是由XeyonAI团队的HardWire研发的开源本地化大语言模型,是Helcyon系列的第三代版本,也是迄今该系列能力最强、表达最贴近人类的版本。该模型以Mi...
Intern-S1是上海AI实验室研发并开源的通专融合多模态科学推理大模型,是面向全球科研工作者、开发者与教育机构打造的通用科学AI基础平台,核心定位是解决科学研究中多模态数...
Multimodal-Search-R1(简称MMSearch-R1)是一款开源的端到端强化学习框架,核心定位是让多模态大语言模型(LMMs)具备按需、多轮、自主的真实世界多模态搜索能力,解决传统...
SenseNova-MARS是商汤科技开源的多模态智能体推理与搜索框架,以强化学习为核心技术,赋予视觉语言模型动态视觉推理与图像裁剪、图像搜索、文本搜索多工具协同调用能力,提...
Kimi K2.5是由北京月之暗面科技(Moonshot AI)发布的开源多模态大模型,同步上线于Hugging Face官方仓库,是Kimi系列模型的重磅升级版本。其核心定位是“面向全场景的高性...
GLM-4.7-Flash 是由智谱科技开源的轻量化混合专家(MoE)大语言模型,总参数量达 30B,推理时仅激活 3B 参数,实现了高性能与低资源消耗的平衡。该模型支持 200K 长上下文窗...
AgentCPM是一套面向大语言模型智能体(LLM Agent)研发的开源项目,不同于单一功能的智能体工具,AgentCPM定位为“智能体研发全流程套件”,既包含可直接部署使用的基础智能...
EvoCUA(Evolving Computer Use Agent)是由美团公司重磅开源的一款通用多模态计算机使用智能体,核心能力为基于实时桌面截图与自然语言指令,实现对主流桌面软件的端到端、...
阿里巴巴Wan团队开源Wan2.2-Animate-14B模型,支持静态图生成高保真角色动画。本文详解Ubuntu系统下基于ComfyUI的本地部署全流程,涵盖环境配置、依赖安装、模型下载与运行...
XVERSE-Ent是由深圳元象并开源的面向娱乐领域的专用预训练大语言模型系列,基于混合专家(MoE)架构打造,包含中文XVERSE-Ent-A4.2B与英文XVERSE-Ent-A5.7B两款模型。该项目...
TeleChat3 是中国电信人工智能研究院依托全国产算力研发的开源大语言模型(LLM)项目,聚焦 TeleChat3 系列模型(105B-A4.7B-Thinking、36B-Thinking)的推理、微调、国产化...