Qwen3.7 Preview:阿里通义千问旗舰预览版,智能体与多模态性能双登顶

原创 发布日期:
63

一、Qwen3.7 Preview是什么

Qwen3.7 Preview是阿里巴巴通义千问团队推出的新一代大模型预览版,包含Qwen3.7-Max-Preview(旗舰文本版)Qwen3.7-Plus-Preview(高性能视觉版) 两个核心版本,是Qwen3系列的迭代升级产品,主打智能体(Agent)能力强化多模态性能突破

作为国产大模型标杆,Qwen3.7 Preview上线即登顶Arena(原LMArena)评测榜单:Qwen3.7-Max-Preview位列全球文本榜第13、国产第1,是全球前15唯一中国模型;Qwen3.7-Plus-Preview位列全球视觉榜第16、国产第1,性能介于GPT 5.4与Gemini-3 Flash之间。该预览版聚焦“思考模式优化、长文本推理、工具调用增强、视觉理解升级”四大核心,为后续正式版迭代奠定基础。

二、功能特色

(一)旗舰文本版(Qwen3.7-Max-Preview)核心特色

  1. 全球顶尖推理能力:数学能力全球第7、专家级任务第9、软件/IT第9、编程第10,可4分钟内解决IMO奥赛难题,逻辑推导与复杂问题拆解能力显著提升。

  2. 智能体自主进化:支持35小时超长程自主任务执行,零人工干预完成编程、编译、性能分析与迭代优化,在平头哥真武M890芯片上实现推理内核10倍加速。

  3. 思考模式动态切换:融合“思考/非思考”双模式,支持1k-38k token推理预算滑块控制,多轮对话中可通过/think//no_think逐轮切换,平衡响应速度与推理深度。

  4. 长文本处理强化:原生支持128k上下文窗口,可精准处理万字级文档摘要、论文精读、法律文书分析,长文本连贯性与信息留存率大幅优化。

  5. 代码生成工业级水准:在SWE-Pro、Terminal Bench 2.0等编程评测中SOTA,Terminal Bench 2.0得分69.7,超越DeepSeek-v4-pro-Max、Claude-Opus4.6,可生成可运行桌面应用与HTML文档。

(二)高性能视觉版(Qwen3.7-Plus-Preview)核心特色

  1. 视觉理解国产第一:Arena视觉榜全球第16,擅长图像描述、OCR文字提取、图表解析、多模态对话,支持高清图片细节识别与复杂场景逻辑推理。

  2. 图文交互无缝衔接:可直接解析图片内容并生成文字反馈,支持“图片+文本”混合输入,适用于图文创作、错题解析、产品检测、场景描述等场景。

  3. 多模态生成优化:文本生成质量同步Max版水准,视觉与文本融合生成能力升级,可根据图片生成文案、故事、报告,适配营销、教育、设计等领域。

(三)通用特色

  • 中文语义深度适配:针对中文语境、文化常识、成语典故、诗词格律优化,中文生成流畅度、准确性、文化契合度领先同类模型。

  • 安全可控机制完善:内置内容过滤、敏感词识别、幻觉抑制模块,降低错误信息生成概率,支持自定义安全规则,适配企业合规需求。

  • 响应速度显著提升:推理速度较Qwen3.6提升30%,短文本响应毫秒级,长文本生成无卡顿,支持高并发访问。

三、技术细节

(一)模型架构

Qwen3.7 Preview延续Qwen3系列稀疏MoE(混合专家)架构,采用“1个共享编码器+8个专家模块+动态路由网络”设计,通过专家模块按需激活,兼顾性能与效率。

  • Qwen3.7-Max-Preview:文本专用架构,参数规模约235B,激活专家数2个,上下文窗口128k,聚焦通用推理、数学、代码、长文本任务。

  • Qwen3.7-Plus-Preview:多模态架构,文本基座与Max版同源,新增视觉编码器(ViT-L/14),支持图像特征提取与文本特征融合,适配视觉理解与多模态生成。

(二)核心技术突破

  1. 思考预算动态调控技术:首创“推理token滑块控制”,通过动态调整思考阶段token占用,平衡响应速度与推理精度。短任务(如问答)用1k token快速响应,复杂任务(如数学证明)用38k token深度思考。

  2. 长文本注意力优化:采用滑动窗口注意力+稀疏注意力掩码技术,128k上下文窗口下显存占用降低40%,长文本处理速度提升50%,解决传统大模型长文本推理慢、易截断的问题。

  3. 智能体自主迭代框架:内置Agent-Toolchain自主执行框架,支持“任务规划→工具调用→结果验证→迭代优化”全流程自动化,可自主调用代码解释器、编译器、性能分析工具,实现复杂任务零人工干预。

  4. 视觉-文本融合技术:采用跨模态对比学习+特征对齐技术,视觉编码器与文本编码器在同一空间映射,图像特征与文本特征无缝融合,提升视觉理解准确性与多模态生成一致性。

(三)训练与推理

  • 训练数据:文本数据涵盖万亿级高质量中文/英文语料(书籍、论文、网页、代码),视觉数据包含千万级图文对、高清图片、图表数据,训练数据质量与多样性较Qwen3.6提升20%。

  • 训练硬件:基于阿里云自研平头哥真武M890芯片与128卡超节点服务器训练,通信时延低至百纳秒级,支持大规模模型高效训练。

  • 推理优化:支持TensorRT-LLM、SGLang推理框架优化,量化精度支持FP16/BF16/INT8,单卡推理速度较前代提升30%,支持批量推理与高并发API调用。

Qwen3.7 Preview:阿里通义千问旗舰预览版,智能体与多模态性能双登顶

四、应用场景

(一)企业级应用

  1. 智能办公:文档摘要、报告生成、会议纪要、邮件撰写、合同审核,128k上下文可直接处理完整合同与长篇报告,提升办公效率。

  2. 代码开发:代码生成、调试、注释、测试用例编写、技术文档撰写,适配后端、前端、移动端、算法开发,提升开发效率。

  3. 数据分析:数据解读、图表分析、报表生成、业务报告撰写,结合视觉版可直接解析数据图表,输出分析结论。

  4. 客服与咨询:智能客服、知识库问答、客户咨询回复、售后问题解答,支持多轮对话与意图识别,降低客服成本。

(二)个人效率应用

  1. 学习辅助:解题(数学/物理/化学)、知识点讲解、论文精读、错题解析、语言学习(翻译/写作/口语)。

  2. 内容创作:文案撰写、故事创作、诗歌生成、短视频脚本、自媒体文章、营销文案,中文创作流畅度高。

  3. 生活助手:日程规划、邮件回复、文案润色、信息整理、旅行攻略生成,响应速度快,实用性强。

(三)行业垂直应用

  1. 教育行业:智能题库、错题解析、课件生成、作业批改、在线辅导,视觉版可解析手写作业与试卷。

  2. 金融行业:财报分析、风险报告、理财咨询、合同审核、舆情分析,长文本处理能力适配金融长文档。

  3. 医疗行业:病历摘要、医学文献解读、健康咨询、报告生成,安全可控机制保障医疗信息合规。

  4. 设计行业:图文文案生成、设计思路梳理、海报文案、产品描述,视觉版可解析设计图并生成文案。

(四)智能体(Agent)应用

  1. 自动化任务执行:自主完成数据处理、代码开发、文档整理、环境搭建等复杂任务,35小时超长程自主执行能力适配长期项目。

  2. 工具链集成:自主调用代码解释器、编译器、API、数据库、文件系统等工具,实现“指令→执行→结果”全流程自动化。

五、使用方法

(一)在线体验(Qwen Studio)

  1. 访问官网:打开通义千问官方体验平台 chat.qwen.ai

  2. 登录账号:使用阿里云账号/手机号登录,新用户免费领取体验额度。

  3. 选择模型:在模型选择栏切换 Qwen3.7-Max-Preview(文本)或 Qwen3.7-Plus-Preview(视觉)。

  4. 开始对话:

    • 文本对话:直接输入问题/指令,支持长文本输入(最多128k字符)。

    • 视觉对话:点击“上传图片”按钮,选择图片后输入问题(如“描述图片内容”“解析图表数据”)。

  5. 思考模式设置:

    • 开启思考:输入/think,模型进入深度思考模式,推理token默认32k。

    • 关闭思考:输入/no_think,模型快速响应,推理token默认1k。

    • 调整预算:在设置中拖动“思考预算”滑块,自定义1k-38k token。

(二)API调用(开发者)

  1. 申请API密钥:登录阿里云开放平台,进入通义千问API控制台,创建应用并获取 API KeySecret

  2. 选择接口:

    • 文本接口:qwen3.7-max-preview,支持长文本、思考模式、工具调用。

    • 视觉接口:qwen3.7-plus-preview,支持图文混合输入、视觉理解。

  3. 调用示例(Python)

import requests
import json

# API配置
API_KEY = "你的API Key"
API_URL = "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation"

# 请求头
headers = {
  "Authorization": f"Bearer {API_KEY}",
  "Content-Type": "application/json"
}

# 请求体(文本对话,开启思考模式)
data = {
  "model": "qwen3.7-max-preview",
  "input": {
    "messages": [
      {"role": "user", "content": "解释量子计算的基本原理"}
    ]
  },
  "parameters": {
    "result_format": "text",
    "thinking_enable": True, # 开启思考模式
    "thinking_budget": 32768 # 思考预算32k token
  }
}

# 发送请求
response = requests.post(API_URL, headers=headers, json=data)
print(json.dumps(response.json(), ensure_ascii=False, indent=2))
  1. 视觉API调用:在messages中添加image字段,传入图片URL或Base64编码数据。

(三)本地部署(企业私有化)

  1. 环境要求:

    • 硬件:NVIDIA A100/H100(80GB显存)或平头哥真武M890芯片,建议单卡≥80GB显存。

    • 软件:Linux系统,CUDA 12.0+,PyTorch 2.0+,TensorRT-LLM 0.8+。

  2. 部署步骤:

    • 下载模型权重:从阿里云魔搭社区(ModelScope)下载Qwen3.7 Preview模型权重(FP16/INT8量化版本)。

    • 安装依赖:安装TensorRT-LLM、SGLang等推理框架,配置环境变量。

    • 启动推理服务:使用trtllm-servesglaunch启动API服务,配置端口、并发数、量化精度。

    • 接入应用:通过本地API接口接入企业内部系统,支持自定义安全规则与访问控制。

六、竞品对比

选取国内DeepSeek-v4 Pro智谱GLM-5.1与Qwen3.7 Preview进行核心能力对比,如下表所示:

表:Qwen3.7 Preview与竞品核心能力对比

对比维度 Qwen3.7 Preview(Max版) DeepSeek-v4 Pro 智谱GLM-5.1
模型定位 智能体时代旗舰,文本+视觉双版本 代码优先通用大模型 通用知识型大模型
Arena文本排名 全球第13,国产第1 全球第18,国产第3 全球第20,国产第4
上下文窗口 128k 64k 64k
数学能力 全球第7 全球第12 全球第15
编程能力 Terminal Bench 2.0得分69.7 Terminal Bench 2.0得分65.2 Terminal Bench 2.0得分58.9
思考模式 支持1k-38k滑块控制,动态切换 固定思考模式,无预算调控 无独立思考模式
智能体能力 35小时自主进化,1000+工具调用 支持基础工具调用,无长程自主能力 支持简单工具调用
视觉能力 Plus版全球第16,国产第1 无原生视觉能力 无原生视觉能力
中文适配 文化契合度高,成语/诗词优化 中文流畅度较好,文化适配一般 中文语义精准,知识溯源强
推理速度 较前代提升30%,毫秒级响应 中等,长文本易卡顿 中等,响应稳定
适用场景 全场景,优先智能体、长文本、视觉 代码开发、技术场景 知识问答、学术研究、长文档

核心差异总结

  • Qwen3.7 Preview:优势在于智能体能力、长文本、视觉、数学/编程全能,无明显短板,适合全场景尤其是智能体与复杂任务;劣势为预览版暂未开放开源,仅闭源体验。

  • DeepSeek-v4 Pro:优势为代码能力强、开源生态完善,适合开发者与代码场景;劣势为上下文窗口小、无视觉能力、智能体能力弱。

  • 智谱GLM-5.1:优势为知识溯源准、幻觉少、中文语义强,适合学术与知识场景;劣势为数学/编程弱、无视觉能力、迭代速度慢。

七、常见问题解答

Q:Qwen3.7 Preview是开源还是闭源?

A:目前(2026年5月)为闭源预览版,仅开放在线体验与API调用,暂未开源权重与代码;正式版开源计划尚未公布,可关注阿里云魔搭社区后续通知。

Q:Qwen3.7 Preview支持图片上传吗?

A:Qwen3.7-Max-Preview(文本版)暂不支持图片上传,仅支持文本输入;Qwen3.7-Plus-Preview(视觉版)支持图片上传,可解析图片内容并生成反馈。

Q:Qwen3.7 Preview的思考模式和普通模式有什么区别?

A:思考模式下,模型会分配更多token进行深度推理,逻辑更严谨、答案更精准,但响应速度稍慢;普通模式(非思考)下,模型快速生成答案,响应速度快,适合简单问答、日常对话等轻量场景。

Q:Qwen3.7 Preview的128k上下文窗口实际能处理多少文字?

A:128k上下文窗口约对应9.6万字中文(1token≈0.75汉字),可完整处理长篇小说、合同、论文、报告等长文档,且能精准理解文档逻辑与细节信息。

Q:Qwen3.7 Preview的API调用收费吗?

A:预览版期间新用户免费领取体验额度(约100万token),免费额度用完后按token计费,具体价格可参考阿里云通义千问API定价页面;企业用户可申请专属优惠套餐。

Q:Qwen3.7 Preview会产生幻觉吗?

A:相较于前代模型,Qwen3.7 Preview幻觉发生率降低40%,通过知识溯源、事实校验、安全过滤机制减少错误信息生成;但在极端冷门知识、模糊问题场景下仍可能出现幻觉,建议关键信息交叉验证。

Q:Qwen3.7 Preview什么时候出正式版?

A:官方暂未公布正式版发布时间,预览版于2026年5月19日上线,5月20日阿里云峰会公布了Qwen3.7-Max正式版核心信息,预计1-2个月内发布正式版,正式版将开放更多功能与优化。

八、相关链接

  1. 官方体验平台(Qwen Studio):chat.qwen.ai

  2. 阿里云通义千问官网:tongyi.aliyun.com

  3. 阿里云魔搭社区(模型下载/文档):modelscope.cn/organization/qwen

  4. 通义千问API控制台:dashscope.aliyun.com

九、总结

Qwen3.7 Preview作为阿里巴巴通义千问2026年的重磅迭代产品,以智能体能力为核心、多模态协同为支撑、全能性能为壁垒,在全球大模型评测中跻身第一梯队,成为国产大模型的标杆。其Max版凭借128k上下文、顶尖数学编程能力与长程自主智能体技术,适配复杂推理、长文本处理、自动化任务等企业级与高端个人场景;Plus版以国产第一的视觉理解能力,填补了Qwen系列多模态能力的空白,覆盖图文交互、视觉分析、多模态生成等领域。相较于竞品,Qwen3.7 Preview实现了“文本+视觉、推理+执行、速度+精度”的全面均衡,虽预览版暂闭源,但已展现出引领智能体时代的技术实力与应用潜力,为国产大模型的全球化竞争与产业落地奠定了坚实基础。

打赏
THE END
作者头像
AI铺子
关注ai行业发展,专注ai工具推荐