大语言模型

Bee：清华大学联合腾讯混元推出的全开源多模态大语言模型

Bee是由清华大学与腾讯混元团队联合研发的全开源多模态大语言模型（MLLMs）全栈解决方案，项目通过三大核心产出——1500万条双级思维链（CoT）增强的高质量SFT数据集Honey-...

8个月前 AI新闻

101

OmniVinci：NVIDIA开源的全模态理解大语言模型，高效融合视觉、音频与文本信息

OmniVinci是由NVIDIA等机构开发的开源全模态理解大语言模型（Omni-Modal Understanding LLM），旨在通过创新架构与高效数据构建，实现对视觉（图像、视频）、音频、文本信息...

8个月前 AI新闻

124

一文读懂大语言模型（LLM）工作机制：从原理到实用指南

本文通俗拆解大语言模型（LLM）工作机制，从核心原理（概率预测 token、Transformer 注意力机制）、五大技术架构模块、预训练 - 微调 - 对齐三阶段训练流程，到 “写智能台...

9个月前 AI教程

748

BitNet：微软开源1-bit大语言模型高效推理框架

BitNet是微软推出的一个开源1-bit大语言模型推理框架，专门用于运行1-bit量化的大语言模型（LLM）。该项目最初是为了支持微软自研的BitNet b1.58模型而创建的，但现在已经扩...

9个月前 AI新闻

49

Ming-UniAudio：开源统一语音处理框架，支持语音理解、生成与编辑的端到端模型

Ming-UniAudio是一个创新的开源框架，旨在统一语音理解、生成和编辑任务。通过基于VAE框架和因果Transformer架构的统一连续语音tokenizer（MingTok-Audio），它能够有效整合...

9个月前 AI新闻

106

xLLM：京东开源的高性能大语言模型推理引擎，支持国产 AI 加速器

xLLM 是京东开源的一款高性能大语言模型推理框架，专为国产 AI 加速器优化，采用服务 - 引擎解耦架构，实现高效的企业级部署。该框架通过全图流水线执行、动态形状图优化、...

9个月前 AI新闻

57

LongCat-Flash-Chat：美团推出的高性能大语言模型聊天系统

LongCat-Flash-Chat 是美团开源的一款高性能大语言模型聊天系统，基于 LongCat-Flash 大模型架构构建。该项目旨在提供一个高性能、低延迟、可扩展的大语言模型聊天解决方案...

10个月前 AI新闻

139

CWM (Code World Model) ：Meta 开源的 320B 参数代码世界模型

CWM (Code World Model) 是 Meta 发布的一个 320 亿参数的开源大语言模型，专为代码生成和代码状态推理而设计。它不仅能理解和生成代码，还能通过工具调用与容器化环境交互...

10个月前 AI新闻

119

AI大语言模型如何改变生活：用Qwen-Image轻松制作专业级海报

从简单的文本生成到复杂的多模态内容创作，AI正以前所未有的方式降低创意表达的门槛。本文将深入探讨如何利用大语言模型特别是通义千问的多模态模型Qwen-Image，来解决生活...

10个月前 AI教程

29

SpikingBrain-7B：融合脉冲编码与 MoE 架构的高效能大语言模型

SpikingBrain-7B是一个受大脑神经机制启发的大型语言模型项目，该项目的核心目标是通过创新的架构设计和技术整合，解决传统大语言模型在计算效率、能耗和长序列处理方面的局...

10个月前 AI新闻

54

FastMTP：腾讯开源的大语言模型推理加速技术

FastMTP是由腾讯BAC团队开发的一种针对大语言模型（LLM）的高效推理加速技术，旨在通过增强多token预测（Multi-Token Prediction, MTP）能力来显著提升大语言模型的推理速度...

10个月前 AI新闻

100

Ling-V2：开源高效能MoE架构大语言模型，兼顾效率与复杂推理能力

Ling-V2是一款基于混合专家（Mixture of Experts，MoE）架构设计的开源大型语言模型系列，旨在实现高性能与计算效率的完美平衡。作为开源大语言模型领域的创新成果，Ling-V...

10个月前 AI新闻

108