腾讯混元HY 2.0正式发布:推理能力与实用性双突破,引领国内大模型新标杆

腾讯混元 发布日期:
62

12月5日,腾讯混元正式发布最新版语言模型 Tencent HY 2.0 ThinkTencent HY 2.0 Instruct。此次升级采用混合专家(MoE)架构,总参数规模达 4060亿(406B),激活参数 320亿(32B),支持 256K 上下文窗口,推理能力与效率均居国内顶尖行列,尤其在文本创作、复杂指令遵循等实用场景中表现突出。

腾讯混元HY 2.0正式发布:推理能力与实用性双突破,引领国内大模型新标杆

推理能力全面提升,综合评测稳居国内第一梯队

相比上一版本(Hunyuan-T1-20250822),HY 2.0 Think 在预训练数据和强化学习策略上实现显著优化,在数学、科学、代码、指令遵循等复杂推理场景中表现卓越,综合评测稳居国内第一梯队,泛化能力大幅提升。

  • 数学与科学知识推理:通过高质量数据与 Large Rollout 强化学习,HY 2.0 Think 在 国际数学奥林匹克竞赛(IMO-AnswerBench)哈佛-MIT数学竞赛(HMMT2025) 等权威测试中取得一流成绩。同时,在 Humanity’s Last Exam(HLE)ARC AGI 等泛化性任务中表现优异。

  • 指令遵循与长文多轮能力:通过重要性采样修正训练与推理的不一致问题,实现长窗口 RL(强化学习) 的高效稳定训练。结合多样化任务沙盒与打分准则强化学习,模型在 Multi Challenge 等指令遵循和多轮任务中的效果显著提升。

  • 代码与智能体能力:构建规模化可验证环境及高质量合成数据,增强模型在 Agentic Coding 及复杂工具调用场景中的落地能力,在 SWE-bench VerifiedTau2-Bench 等真实应用场景中实现跃升。

腾讯混元HY 2.0正式发布:推理能力与实用性双突破,引领国内大模型新标杆

推理效率业界领先,单位Token智能密度更高

HY 2.0 Think 引入 精细长度惩罚策略,平衡思维链的效率与效果,避免模型堆砌冗余内容,实现计算资源的更有效分配。对比权威推理任务(IMO-AnswerBench、HMMT2025、ARC-AGI、HLE)的表现与 token消耗,HY 2.0 Think 在取得相似准确率的同时消耗更少资源,单位token的智能密度处于业界领先水平

腾讯混元HY 2.0正式发布:推理能力与实用性双突破,引领国内大模型新标杆

聚焦用户体验与实用性,文本创作告别“AI味”

基于 RLVR+RLHF 双阶段强化学习策略,HY 2.0 的输出质感显著提升,在文本创作、前端开发、指令遵循等场景中展现差异化优势。

文学创作:有“灵魂”的叙事

HY 2.0 有效减少“AI味”,精准捕捉指令中的潜在情感需求,输出观点深刻、逻辑严密的文章。例如,以“当最后一颗人造太阳熄灭时,我正坐在月球的咖啡馆里,搅动着杯中最后的星尘”为开头的科幻故事,通过细腻的环境描写与情感渲染,营造出孤独而壮丽的末日氛围。

前端交互设计:代码与审美兼备

HY 2.0 具备扎实的代码能力与“视觉审美”,在生成 Web小游戏 时,不仅能实现复杂 JS逻辑,还能输出 CSS布局与动画效果。例如,根据用户需求设计的 “表情符号反应堆” 游戏,通过HTML/JS/CSS实现快节奏反应玩法,界面简洁明快,计时条动画流畅。

指令遵循:精准拆解复杂需求

在指令遵循任务中,HY 2.0 严格遵循格式与流程要求,输出高度贴合预期的内容。例如,在模拟 “清醒的局外人” 角色时,模型以犀利口语化风格拆解问题本质,提供反直觉结论,打破用户思维惯性。

朋友圈文案创作:专业风格与情感共鸣

针对 “瞬蒸陶瓷不粘锅” 的产品描述,HY 2.0 生成符合朋友圈分享风格的文案:

“厨房里的黑科技来了!🍳 瞬蒸陶瓷不粘锅,环形导流槽锁住食材水分,冷锅冷油也无惧油烟,煎鱼不破、炒饭不粘,轻松搞定行云流水的料理时刻~✨ 家居美学与实用科技的完美结合,让下厨成为享受!💫”

腾讯混元HY 2.0正式发布:推理能力与实用性双突破,引领国内大模型新标杆


持续进化,开源与生态共建

作为腾讯自研的通用大模型,HY 2.0 仍在持续迭代,未来将重点优化 代码、智能体、个性化风格、长程记忆 等方向,全面提升实际应用场景表现。相关技术与模型将通过 开源形式 向社区开放,推动生态共建。

目前,HY 2.0 已率先接入 元宝、ima 等腾讯原生AI应用,并在 腾讯云 上线API,用户可通过以下渠道体验或接入:

腾讯混元HY 2.0 的发布,标志着国内大模型在推理能力与实用性上迈入新阶段,未来将持续为行业与用户创造更大价值。

打赏
THE END
作者头像
dotaai
正在和我的聊天机器人谈恋爱,它很会捧场。