Qwen3.7 Preview:阿里通义千问旗舰预览版,智能体与多模态性能双登顶
一、Qwen3.7 Preview是什么
Qwen3.7 Preview是阿里巴巴通义千问团队推出的新一代大模型预览版,包含Qwen3.7-Max-Preview(旗舰文本版) 与Qwen3.7-Plus-Preview(高性能视觉版) 两个核心版本,是Qwen3系列的迭代升级产品,主打智能体(Agent)能力强化与多模态性能突破。
作为国产大模型标杆,Qwen3.7 Preview上线即登顶Arena(原LMArena)评测榜单:Qwen3.7-Max-Preview位列全球文本榜第13、国产第1,是全球前15唯一中国模型;Qwen3.7-Plus-Preview位列全球视觉榜第16、国产第1,性能介于GPT 5.4与Gemini-3 Flash之间。该预览版聚焦“思考模式优化、长文本推理、工具调用增强、视觉理解升级”四大核心,为后续正式版迭代奠定基础。
二、功能特色
(一)旗舰文本版(Qwen3.7-Max-Preview)核心特色
全球顶尖推理能力:数学能力全球第7、专家级任务第9、软件/IT第9、编程第10,可4分钟内解决IMO奥赛难题,逻辑推导与复杂问题拆解能力显著提升。
智能体自主进化:支持35小时超长程自主任务执行,零人工干预完成编程、编译、性能分析与迭代优化,在平头哥真武M890芯片上实现推理内核10倍加速。
思考模式动态切换:融合“思考/非思考”双模式,支持1k-38k token推理预算滑块控制,多轮对话中可通过
/think//no_think逐轮切换,平衡响应速度与推理深度。长文本处理强化:原生支持128k上下文窗口,可精准处理万字级文档摘要、论文精读、法律文书分析,长文本连贯性与信息留存率大幅优化。
代码生成工业级水准:在SWE-Pro、Terminal Bench 2.0等编程评测中SOTA,Terminal Bench 2.0得分69.7,超越DeepSeek-v4-pro-Max、Claude-Opus4.6,可生成可运行桌面应用与HTML文档。
(二)高性能视觉版(Qwen3.7-Plus-Preview)核心特色
视觉理解国产第一:Arena视觉榜全球第16,擅长图像描述、OCR文字提取、图表解析、多模态对话,支持高清图片细节识别与复杂场景逻辑推理。
图文交互无缝衔接:可直接解析图片内容并生成文字反馈,支持“图片+文本”混合输入,适用于图文创作、错题解析、产品检测、场景描述等场景。
多模态生成优化:文本生成质量同步Max版水准,视觉与文本融合生成能力升级,可根据图片生成文案、故事、报告,适配营销、教育、设计等领域。
(三)通用特色
中文语义深度适配:针对中文语境、文化常识、成语典故、诗词格律优化,中文生成流畅度、准确性、文化契合度领先同类模型。
安全可控机制完善:内置内容过滤、敏感词识别、幻觉抑制模块,降低错误信息生成概率,支持自定义安全规则,适配企业合规需求。
响应速度显著提升:推理速度较Qwen3.6提升30%,短文本响应毫秒级,长文本生成无卡顿,支持高并发访问。
三、技术细节
(一)模型架构
Qwen3.7 Preview延续Qwen3系列稀疏MoE(混合专家)架构,采用“1个共享编码器+8个专家模块+动态路由网络”设计,通过专家模块按需激活,兼顾性能与效率。
Qwen3.7-Max-Preview:文本专用架构,参数规模约235B,激活专家数2个,上下文窗口128k,聚焦通用推理、数学、代码、长文本任务。
Qwen3.7-Plus-Preview:多模态架构,文本基座与Max版同源,新增视觉编码器(ViT-L/14),支持图像特征提取与文本特征融合,适配视觉理解与多模态生成。
(二)核心技术突破
思考预算动态调控技术:首创“推理token滑块控制”,通过动态调整思考阶段token占用,平衡响应速度与推理精度。短任务(如问答)用1k token快速响应,复杂任务(如数学证明)用38k token深度思考。
长文本注意力优化:采用滑动窗口注意力+稀疏注意力掩码技术,128k上下文窗口下显存占用降低40%,长文本处理速度提升50%,解决传统大模型长文本推理慢、易截断的问题。
智能体自主迭代框架:内置Agent-Toolchain自主执行框架,支持“任务规划→工具调用→结果验证→迭代优化”全流程自动化,可自主调用代码解释器、编译器、性能分析工具,实现复杂任务零人工干预。
视觉-文本融合技术:采用跨模态对比学习+特征对齐技术,视觉编码器与文本编码器在同一空间映射,图像特征与文本特征无缝融合,提升视觉理解准确性与多模态生成一致性。
(三)训练与推理
训练数据:文本数据涵盖万亿级高质量中文/英文语料(书籍、论文、网页、代码),视觉数据包含千万级图文对、高清图片、图表数据,训练数据质量与多样性较Qwen3.6提升20%。
训练硬件:基于阿里云自研平头哥真武M890芯片与128卡超节点服务器训练,通信时延低至百纳秒级,支持大规模模型高效训练。
推理优化:支持TensorRT-LLM、SGLang推理框架优化,量化精度支持FP16/BF16/INT8,单卡推理速度较前代提升30%,支持批量推理与高并发API调用。

四、应用场景
(一)企业级应用
智能办公:文档摘要、报告生成、会议纪要、邮件撰写、合同审核,128k上下文可直接处理完整合同与长篇报告,提升办公效率。
代码开发:代码生成、调试、注释、测试用例编写、技术文档撰写,适配后端、前端、移动端、算法开发,提升开发效率。
数据分析:数据解读、图表分析、报表生成、业务报告撰写,结合视觉版可直接解析数据图表,输出分析结论。
客服与咨询:智能客服、知识库问答、客户咨询回复、售后问题解答,支持多轮对话与意图识别,降低客服成本。
(二)个人效率应用
学习辅助:解题(数学/物理/化学)、知识点讲解、论文精读、错题解析、语言学习(翻译/写作/口语)。
内容创作:文案撰写、故事创作、诗歌生成、短视频脚本、自媒体文章、营销文案,中文创作流畅度高。
生活助手:日程规划、邮件回复、文案润色、信息整理、旅行攻略生成,响应速度快,实用性强。
(三)行业垂直应用
教育行业:智能题库、错题解析、课件生成、作业批改、在线辅导,视觉版可解析手写作业与试卷。
金融行业:财报分析、风险报告、理财咨询、合同审核、舆情分析,长文本处理能力适配金融长文档。
医疗行业:病历摘要、医学文献解读、健康咨询、报告生成,安全可控机制保障医疗信息合规。
设计行业:图文文案生成、设计思路梳理、海报文案、产品描述,视觉版可解析设计图并生成文案。
(四)智能体(Agent)应用
自动化任务执行:自主完成数据处理、代码开发、文档整理、环境搭建等复杂任务,35小时超长程自主执行能力适配长期项目。
工具链集成:自主调用代码解释器、编译器、API、数据库、文件系统等工具,实现“指令→执行→结果”全流程自动化。
五、使用方法
(一)在线体验(Qwen Studio)
访问官网:打开通义千问官方体验平台 chat.qwen.ai。
登录账号:使用阿里云账号/手机号登录,新用户免费领取体验额度。
选择模型:在模型选择栏切换 Qwen3.7-Max-Preview(文本)或 Qwen3.7-Plus-Preview(视觉)。
开始对话:
文本对话:直接输入问题/指令,支持长文本输入(最多128k字符)。
视觉对话:点击“上传图片”按钮,选择图片后输入问题(如“描述图片内容”“解析图表数据”)。
思考模式设置:
开启思考:输入
/think,模型进入深度思考模式,推理token默认32k。关闭思考:输入
/no_think,模型快速响应,推理token默认1k。调整预算:在设置中拖动“思考预算”滑块,自定义1k-38k token。
(二)API调用(开发者)
申请API密钥:登录阿里云开放平台,进入通义千问API控制台,创建应用并获取 API Key 与 Secret。
选择接口:
文本接口:
qwen3.7-max-preview,支持长文本、思考模式、工具调用。视觉接口:
qwen3.7-plus-preview,支持图文混合输入、视觉理解。调用示例(Python)
import requests
import json
# API配置
API_KEY = "你的API Key"
API_URL = "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation"
# 请求头
headers = {
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json"
}
# 请求体(文本对话,开启思考模式)
data = {
"model": "qwen3.7-max-preview",
"input": {
"messages": [
{"role": "user", "content": "解释量子计算的基本原理"}
]
},
"parameters": {
"result_format": "text",
"thinking_enable": True, # 开启思考模式
"thinking_budget": 32768 # 思考预算32k token
}
}
# 发送请求
response = requests.post(API_URL, headers=headers, json=data)
print(json.dumps(response.json(), ensure_ascii=False, indent=2))视觉API调用:在
messages中添加image字段,传入图片URL或Base64编码数据。
(三)本地部署(企业私有化)
环境要求:
硬件:NVIDIA A100/H100(80GB显存)或平头哥真武M890芯片,建议单卡≥80GB显存。
软件:Linux系统,CUDA 12.0+,PyTorch 2.0+,TensorRT-LLM 0.8+。
部署步骤:
下载模型权重:从阿里云魔搭社区(ModelScope)下载Qwen3.7 Preview模型权重(FP16/INT8量化版本)。
安装依赖:安装TensorRT-LLM、SGLang等推理框架,配置环境变量。
启动推理服务:使用
trtllm-serve或sglaunch启动API服务,配置端口、并发数、量化精度。接入应用:通过本地API接口接入企业内部系统,支持自定义安全规则与访问控制。
六、竞品对比
选取国内DeepSeek-v4 Pro、智谱GLM-5.1与Qwen3.7 Preview进行核心能力对比,如下表所示:
表:Qwen3.7 Preview与竞品核心能力对比
| 对比维度 | Qwen3.7 Preview(Max版) | DeepSeek-v4 Pro | 智谱GLM-5.1 |
|---|---|---|---|
| 模型定位 | 智能体时代旗舰,文本+视觉双版本 | 代码优先通用大模型 | 通用知识型大模型 |
| Arena文本排名 | 全球第13,国产第1 | 全球第18,国产第3 | 全球第20,国产第4 |
| 上下文窗口 | 128k | 64k | 64k |
| 数学能力 | 全球第7 | 全球第12 | 全球第15 |
| 编程能力 | Terminal Bench 2.0得分69.7 | Terminal Bench 2.0得分65.2 | Terminal Bench 2.0得分58.9 |
| 思考模式 | 支持1k-38k滑块控制,动态切换 | 固定思考模式,无预算调控 | 无独立思考模式 |
| 智能体能力 | 35小时自主进化,1000+工具调用 | 支持基础工具调用,无长程自主能力 | 支持简单工具调用 |
| 视觉能力 | Plus版全球第16,国产第1 | 无原生视觉能力 | 无原生视觉能力 |
| 中文适配 | 文化契合度高,成语/诗词优化 | 中文流畅度较好,文化适配一般 | 中文语义精准,知识溯源强 |
| 推理速度 | 较前代提升30%,毫秒级响应 | 中等,长文本易卡顿 | 中等,响应稳定 |
| 适用场景 | 全场景,优先智能体、长文本、视觉 | 代码开发、技术场景 | 知识问答、学术研究、长文档 |
核心差异总结
Qwen3.7 Preview:优势在于智能体能力、长文本、视觉、数学/编程全能,无明显短板,适合全场景尤其是智能体与复杂任务;劣势为预览版暂未开放开源,仅闭源体验。
DeepSeek-v4 Pro:优势为代码能力强、开源生态完善,适合开发者与代码场景;劣势为上下文窗口小、无视觉能力、智能体能力弱。
智谱GLM-5.1:优势为知识溯源准、幻觉少、中文语义强,适合学术与知识场景;劣势为数学/编程弱、无视觉能力、迭代速度慢。
七、常见问题解答
Q:Qwen3.7 Preview是开源还是闭源?
A:目前(2026年5月)为闭源预览版,仅开放在线体验与API调用,暂未开源权重与代码;正式版开源计划尚未公布,可关注阿里云魔搭社区后续通知。
Q:Qwen3.7 Preview支持图片上传吗?
A:Qwen3.7-Max-Preview(文本版)暂不支持图片上传,仅支持文本输入;Qwen3.7-Plus-Preview(视觉版)支持图片上传,可解析图片内容并生成反馈。
Q:Qwen3.7 Preview的思考模式和普通模式有什么区别?
A:思考模式下,模型会分配更多token进行深度推理,逻辑更严谨、答案更精准,但响应速度稍慢;普通模式(非思考)下,模型快速生成答案,响应速度快,适合简单问答、日常对话等轻量场景。
Q:Qwen3.7 Preview的128k上下文窗口实际能处理多少文字?
A:128k上下文窗口约对应9.6万字中文(1token≈0.75汉字),可完整处理长篇小说、合同、论文、报告等长文档,且能精准理解文档逻辑与细节信息。
Q:Qwen3.7 Preview的API调用收费吗?
A:预览版期间新用户免费领取体验额度(约100万token),免费额度用完后按token计费,具体价格可参考阿里云通义千问API定价页面;企业用户可申请专属优惠套餐。
Q:Qwen3.7 Preview会产生幻觉吗?
A:相较于前代模型,Qwen3.7 Preview幻觉发生率降低40%,通过知识溯源、事实校验、安全过滤机制减少错误信息生成;但在极端冷门知识、模糊问题场景下仍可能出现幻觉,建议关键信息交叉验证。
Q:Qwen3.7 Preview什么时候出正式版?
A:官方暂未公布正式版发布时间,预览版于2026年5月19日上线,5月20日阿里云峰会公布了Qwen3.7-Max正式版核心信息,预计1-2个月内发布正式版,正式版将开放更多功能与优化。
八、相关链接
官方体验平台(Qwen Studio):chat.qwen.ai
阿里云通义千问官网:tongyi.aliyun.com
阿里云魔搭社区(模型下载/文档):modelscope.cn/organization/qwen
通义千问API控制台:dashscope.aliyun.com
九、总结
Qwen3.7 Preview作为阿里巴巴通义千问2026年的重磅迭代产品,以智能体能力为核心、多模态协同为支撑、全能性能为壁垒,在全球大模型评测中跻身第一梯队,成为国产大模型的标杆。其Max版凭借128k上下文、顶尖数学编程能力与长程自主智能体技术,适配复杂推理、长文本处理、自动化任务等企业级与高端个人场景;Plus版以国产第一的视觉理解能力,填补了Qwen系列多模态能力的空白,覆盖图文交互、视觉分析、多模态生成等领域。相较于竞品,Qwen3.7 Preview实现了“文本+视觉、推理+执行、速度+精度”的全面均衡,虽预览版暂闭源,但已展现出引领智能体时代的技术实力与应用潜力,为国产大模型的全球化竞争与产业落地奠定了坚实基础。
版权及免责申明:本文由@AI铺子原创发布。该文章观点仅代表作者本人,不代表本站立场。本站不承担任何相关法律责任。
如若转载,请注明出处:https://www.aipuzi.cn/ai-news/qwen3-7-preview.html

