什么是草稿链(CoD)?3 分钟搞懂生成式 AI 的 “迭代优化” 新方法
什么是草稿链(CoD)?本文深度解析生成式AI的全新推理范式——草稿链(Chain of Draft)。揭秘CoD在金融、自动驾驶、实时客服中的落地实战,分析其在零样本场景的局限性及...
什么是草稿链(CoD)?本文深度解析生成式AI的全新推理范式——草稿链(Chain of Draft)。揭秘CoD在金融、自动驾驶、实时客服中的落地实战,分析其在零样本场景的局限性及...
本文深度解析 LangChain 核心概念与架构,涵盖 Model I/O、Chains、Memory、Agents 六大模块。通过实战代码教你从零构建聊天机器人、RAG 知识库及智能 Agent,是大模型开发...
TTT - Discover是由斯坦福大学和英伟达研究团队联合提出的测试时训练框架,其核心创新在于突破传统AI推理阶段冻结模型参数的局限,在测试阶段针对单个具体问题通过强化学习...
TeleChat3 是中国电信人工智能研究院依托全国产算力研发的开源大语言模型(LLM)项目,聚焦 TeleChat3 系列模型(105B-A4.7B-Thinking、36B-Thinking)的推理、微调、国产化...
AgentEvolver是阿里通义实验室开源的AI智能体自进化系统,通过自我提问、自我导航、自我归因三大核心机制,解决传统强化学习(RL)任务稀缺、探索低效、样本利用率低的痛点...
KTransformers是一款基于CPU-GPU异构计算的开源框架,专注于大型语言模型(LLM)的高效推理与微调优化。项目核心包含kt-kernel(高性能推理内核)和kt-sft(轻量化微调框架...
Verl是由字节跳动Seed团队发起、社区共同维护的开源强化学习(RL)训练库,专为大型语言模型(LLMs)设计,该项目以“灵活易用、高效性能、生产级就绪”为核心优势,深度整...
Memori是一款开源的SQL原生LLM内存引擎,由GibsonAI开发维护,核心定位是为AI模型(LLM)、AI代理及多代理系统提供“可持久化、可查询、用户可控”的智能记忆能力。与传统向...
DroidRun是一款开源的移动设备自动化框架,核心定位是通过LLM(大语言模型)智能体实现对Android和iOS设备的自然语言控制,让非技术用户与专业开发者都能轻松完成移动设备的...
Ouro 是多机构联合研发的开源循环语言模型系列,核心创新在于将“推理能力”融入预训练阶段,而非依赖传统大语言模型(LLM)的 post-training 显式文本生成。该系列包含 Ou...
OmniVinci是由NVIDIA等机构开发的开源全模态理解大语言模型(Omni-Modal Understanding LLM),旨在通过创新架构与高效数据构建,实现对视觉(图像、视频)、音频、文本信息...
本文通俗拆解大语言模型(LLM)工作机制,从核心原理(概率预测 token、Transformer 注意力机制)、五大技术架构模块、预训练 - 微调 - 对齐三阶段训练流程,到 “写智能台...
Skyvern是一款基于大语言模型(LLMs)和计算机视觉的开源浏览器工作流自动化工具,旨在解决传统自动化方案(如依赖XPath或DOM解析)的脆弱性问题。它通过视觉理解和逻辑推理...
BitNet是微软推出的一个开源1-bit大语言模型推理框架,专门用于运行1-bit量化的大语言模型(LLM)。该项目最初是为了支持微软自研的BitNet b1.58模型而创建的,但现在已经扩...
想从零开始学习AI大模型?本文带你深入浅出地掌握AI大模型的六大核心概念:提示词(Prompts)、令牌(Tokens)、嵌入(Embeddings)、结构化输出、检索增强生成(RAG)和工...