MiniMax M3：MiniMax推出的百万 Token 全模态国产旗舰大模型

AI新闻 AI工具集 1个月前

123

一、MiniMax M3是什么

MiniMax M3是国内AI企业稀宇科技（MiniMax）发布的旗舰级混合专家大模型，也是全球首款同时集齐前沿编程能力、100万Token超长上下文、原生全模态三大Frontier核心能力的国产开源大模型，配套衍生专属编程智能体产品MiniMax Code，打破此前该三项顶尖能力仅被GPT、Claude、Gemini等海外闭源旗舰垄断的行业格局。

从产品定位划分：

商用层面：面向企业、开发者提供API云端调用服务，覆盖政企数字化、软件开发、内容生产、智能办公全场景；
开源层面：模型权重在发布10日内开源至HuggingFace社区，支持开发者本地私有化部署、二次微调、垂直行业定制；
产品生态：隶属于MiniMax全栈AI产品矩阵，和海螺AI、MiniMax语音大模型、视频生成模型形成协同产品体系，支撑多模态全链路落地。

官方定义的Frontier三件套是M3核心标识：顶尖工程化Coding能力、百万级超长上下文窗口、原生图文视频一体化多模态，三项能力在同一个模型原生融合，非外挂插件拼接实现，也是区分普通大模型与前沿旗舰模型的关键标准。

二、功能特色

M3围绕Frontier三件套延伸五大核心功能模块，所有能力原生集成，无第三方插件依赖，分点详述如下：

2.1 旗舰级工程编程与自主智能体能力

✅ 真实软件工程开发：通过国际权威SWE-Bench Pro编程测评，跑分超越GPT-5.5、Gemini3.1 Pro，逼近Claude Opus4.7，可解析GitHub真实缺陷工单、跨多文件修改工程BUG、全流程搭建项目架构，区别于仅生成零散代码片段的通用代码模型；
✅ MiniMax Code桌面智能操控：依托配套智能体产品，支持自然语言远程操控Windows桌面软件，跨ERP、Excel、办公软件批量自动化操作，例如口述指令即可自动读取表格数据、录入业务系统、生成业务报表，实现全流程无人值守办公；
✅ 长周期自主Agent任务：在Claw-Eval全链路智能体测评榜单位列第一，智能体集群可自主拆解巨型任务、拆分多阶段并发执行、运行中自查纠错，官方实测可连续自主运行数天无需人工干预，自主联网检索资料、迭代方案；
✅ 专业矢量图生成：SVG-Bench矢量图形测评成绩超过Claude Opus4.7，可根据图文描述生成规范商用SVG图标、可视化数据图表、前端页面矢量素材。

2.2 100万Token超大上下文记忆窗口

官方基准上限1000000 Token（1M），日常商用稳定可用512K Token，对比上一代M2.7（200K）提升5倍；单次可完整载入百万字书籍、整套项目源码、数百页招投标文档、全项目需求说明书，模型可精准调取文档首尾细节内容，无上下文遗忘、信息丢失问题；
长上下文适配智能体连续任务，Agent可依托超大记忆存储全周期任务日志、参考资料，实现跨天数连贯执行复杂项目。

2.3 原生一体化多模态理解能力

区别于“文本大模型+外挂视觉编码器”的拼接式多模态方案，M3从预训练初期即采用文本、图片、视频混合统一空间训练，图文视频在模型内部token同构解析，支持多格式文件交错输入：

图片：JPG/PNG/GIF/WEBP格式，单文件上限10MB，支持手写代码截图转可运行源码、图纸解析、报错截图定位BUG；
短视频：MP4/AVI/MOV/MKV格式，单文件上限50MB，解析视频画面+音频内容，一键生成操作文档、视频解说文案、流程代码；
图文混排文档：PDF、扫描件、带截图的工程文档一次性全量输入，跨图文内容汇总分析、提取关键数据。

2.4 分层计费与灵活部署双模式

云端API：分标准版、高速版两类计价，按量计费无强制包月门槛，小微企业、个人开发者可低成本试用；
本地部署：权重开源后支持FP16/INT8多精度量化部署，低显存硬件即可离线私有化部署，满足政企数据不出内网的合规需求。

2.5 极低模型幻觉与商用稳定性

全量训练数据多轮对齐校准，专业领域（金融、法律、编程）内容幻觉率大幅降低，输出逻辑严谨、数据精准，适配企业级生产环境落地；推理阶段首字响应最低80ms，高并发场景输出稳定无截断、乱码问题。

三、技术细节

3.1 模型基础架构参数

架构类型：MoE混合专家架构，总参数量500B，单次推理激活参数45B，采用稀疏激活机制平衡算力消耗与推理性能；
自研核心：MSA（MiniMax Sparse Attention）稀疏注意力架构，为M3专属定制底层注意力算法，是实现1M超长上下文的核心技术支撑；
训练算力底座：基于NVIDIA B300 Blackwell Ultra架构GPU集群完成全量预训练，训练总数据量突破100万亿Token，全周期文本+图像+视频混合预训练，无后期模态微调拼接环节；

量化部署规格：

量化精度	部署硬件门槛	权重体积	适用场景
FP16全精度	单卡A100 80G / 双路RTX4090	≈90GB	企业私有化高精度推理、微调训练
INT8量化	单张40GB显存显卡（RTX4090/3090Ti）	≈45GB	个人本地部署、轻量化API服务

3.2 MSA稀疏注意力核心技术原理

传统全注意力在百万上下文场景下算力随Token平方级暴涨，无法落地商用；MSA通过稀疏选区计算优化：

全局关键token全量注意力计算，段落内普通token局部稀疏注意力；
1M上下文条件下，单Token计算量仅为上代M2.7模型1/20，预填充速度提升9.7倍、解码速度提升15.6倍，大幅降低超长文档推理算力成本；
优化内存读写路径，超长上下文推理显存占用相比主流开源模型降低60%以上。

3.3 推理与工程优化细节

算子全链路定制优化：自研底层推理算子，同等硬件条件下推理效率较通用开源Transformer方案提升4倍；
双推理模式：API支持thinking（深度思考模式）与non-thinking（极速响应模式），深度模式侧重复杂代码、长文档分析，极速模式适配日常对话、短文案生成，用户按需切换降低Token消耗；
多模态统一Tokenizer：图片、视频帧、文本统一编码至同一词表空间，模态交错输入无需格式转码，实现“一段文字+多张截图+短视频”混合并行解析。

3.4 配套MiniMax Code智能体技术底座

依托M3原生能力封装智能体调度框架，内置网页浏览引擎BrowseComp（BrowseComp评测83.5分，高于Claude Opus4.7的79.3分），可自主爬虫检索、跨网页整合资料；内置桌面控制驱动，对接Windows系统接口实现软件点击、文件读写、数据录入全自动化。

MiniMax M3：MiniMax推出的百万 Token 全模态国产旗舰大模型

四、应用场景

依托三大核心能力，M3落地全行业六大类落地场景，覆盖个人、中小企业、大型政企三类用户：

4.1 软件开发与IT研发场景

企业后端项目全栈开发：批量解析项目需求文档，拆分前后端模块，多文件协同编写代码、修复线上BUG，替代初级开发完成单元测试、接口调试；
开源项目维护：导入整套开源仓库源码，梳理项目架构、完善开发文档、迭代版本功能；
代码审计：上传带报错截图的项目文档，自动定位漏洞、生成修复方案与安全整改说明。

4.2 政企数字化智能办公场景

财务自动化：通过MiniMax Code读取Excel发票表格，自动打开ERP系统批量录入凭证、生成月度财务台账；
公文处理：一次性导入整套招投标文件、政策原文（最高百万字），提炼招标要点、风险条款、报价注意事项；
合同审核：PDF合同+补充附件图片全量输入，标注法律风险条款、修改不合理内容、生成修改批注。

4.3 科研学术场景

AI论文全流程复现：上传论文PDF+附录实验视频，M3自主编写实验代码、配置运行环境、复现实验数据、生成结果图表（官方实测独立完成ICLR获奖论文全流程复现耗时12小时）；
文献汇总：批量导入数十篇外文文献，归纳研究方向、梳理技术脉络、生成综述文稿。

4.4 设计与内容创作场景

UI/前端素材生成：上传参考图片，生成前端SVG图标、网页矢量素材、APP界面原型代码；
短视频文案生产：上传短视频原片，自动拆解画面内容，生成脚本、口播文案、字幕文稿。

4.5 智能Agent产品二次开发

开发者基于M3 API/本地权重，搭建行业垂直智能体：电商客服智能体、工业设备巡检智能体、财税机器人，依托1M上下文存储全量知识库，实现长期连续业务处理。

4.6 个人日常使用

程序员本地对接Cursor等IDE插件辅助编码；普通用户上传学习资料、网课录屏，提炼知识点、整理学习笔记。

五、使用方法

M3提供云端API调用、IDE插件接入、本地私有化部署三种使用路径，分步说明实操流程，附代码示例：

5.1 方式一：云端API在线调用（推荐新手/企业商用）

步骤1：平台注册与密钥申请

访问MiniMax官方开放平台，注册企业/个人账户，完成实名认证；
进入账户管理-API Keys栏目，新建密钥（API_KEY），自定义调用限额避免超额扣费。

步骤2：两种代码接入示例

① Python Anthropic SDK适配调用（主流开发方案）

# 安装依赖包
pip install anthropic
# 代码调用示例
from anthropic import Anthropic
# 填入个人申请的API密钥
client = Anthropic(api_key="你的MiniMax_API_KEY", base_url="https://api.minimaxi.chat/v1")
res = client.messages.create(
  model="MiniMax-M3",
  max_tokens=2048,
  messages=[{"role": "user", "content": "基于Python编写简易图书管理系统代码"}]
)
print(res.content[0].text)

② CURL原生HTTP接口调用

curl https://api.minimaxi.chat/v1/text/chat \
-H "Authorization: Bearer 你的API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "MiniMax-M3",
"messages": [{"role": "user", "content": "解析这份产品说明书重点内容"}]
}'

步骤3：套餐选择

个人零星使用：按量计费套餐（标准版输入¥6.4/百万Token、输出¥33.6/百万Token；高速版输入¥16/百万Token、输出¥84/百万Token）；
企业高频调用：包月Token套餐，大流量使用单价更低。

5.2 方式二：IDE编程插件接入

支持Cursor、Claude Code、Roo Code、OpenClaw主流编程工具：

打开IDE设置-模型配置；
在API配置栏填写MiniMax API_KEY与官方接口地址https://api.minimaxi.chat；
模型下拉框选中MiniMax-M3，即可实时代码补全、BUG修复。

5.3 方式三：本地私有化部署（权重开源后）

前往HuggingFace MiniMax官方仓库下载M3量化权重；
部署环境预装vLLM、Transformers推理框架；
运行启动脚本，开启本地API服务，内网应用直接对接本地接口，数据全程不出服务器。

六、竞品对比

选取两款海外闭源旗舰+一款国产开源代码大模型，从架构、上下文、多模态、编程跑分、部署模式、API定价六大维度横向对比：

对比维度	MiniMax M3	Claude Opus4.7	GPT-5.5	DeepSeek V2-Coder
模型架构	MoE混合专家，总参500B，激活45B	稠密大参数架构	混合稀疏架构	稠密单专家架构
上下文上限	100万Token，稳定可用512K	200K Token	128K Token	128K Token
多模态属性	原生图文视频一体化训练，全格式原生解析	外挂视觉编码器，仅支持图片输入	原生图文，不支持短视频	仅纯文本，无多模态能力
SWE-Bench Pro编程跑分	＞GPT5.5、Gemini3.1，贴近Opus4.7	行业顶尖基准	低于M3	远低于M3，仅42%左右
部署方式	云端API+10日内开源本地私有化部署	仅闭源云端API，不开放权重	闭源API，无开源计划	开源本地部署+云端API
百万Token输出单价(人民币)	标准版33.6元、高速84元	≈190元	≈215元	≈42元（仅文本）

对比总结：M3是唯一同时实现百万上下文+原生全模态+顶尖工程编程+开源落地的产品；Opus、GPT性能顶尖但闭源无法私有化、定价高昂；DeepSeek V2仅聚焦代码，缺失长上下文与原生多模态能力，综合场景落地能力弱于M3。

七、常见问题解答

Q1：MiniMax M3权重什么时候开源？开源后可以商用免费微调吗？

A：官方发布公告说明M3正式发布后10日内将完整权重上传至HuggingFace开源仓库，开源协议支持非商用免费使用；企业商用二次微调需要遵循MiniMax开源许可协议，商用落地需完成产品报备，无额外授权费。

Q2：M3的100万Token上下文是理论参数还是实际可用？一次性输入百万字文档会不会出现内容丢失？

A：1M为官方实测可用上限，商用API默认开放512K稳定档位，实测80万字全量文档一次性输入后，模型可精准调取文档中段、末尾细节内容；超大上下文依托MSA稀疏注意力优化，不会出现信息截断、遗忘问题，极端1M全量输入仅会小幅提升单次推理耗时。

Q3：MiniMax Code桌面智能操控支持MacOS系统吗？目前仅支持Windows？

A：当前首发版本仅原生适配全系列Windows系统（Win10/Win11），MacOS版本正在迭代开发，后续通过版本更新上线，现阶段Mac用户可通过Windows虚拟机联动使用桌面自动化功能。

Q4：API调用区分thinking和non-thinking两种模式，两种模式怎么选择更节省成本？

A：日常对话、短文案生成、简单代码片段生成选用non-thinking极速模式，Token消耗更低、计费更便宜；复杂项目开发、百万字文档分析、学术论文复现选择thinking深度思考模式，推理精度更高、逻辑完整性更强，按需切换优化调用成本。

Q5：INT8量化后的本地M3会不会出现性能大幅缩水，编程能力明显下降？

A：官方优化量化算法，INT8版本仅小幅损失约3%-5%基准跑分，日常商用、开发编程、多模态解析性能接近全精度FP16版本，个人本地部署优先选用INT8量化权重即可。

Q6：M3原生支持短视频输入，单视频50MB上限能否扩容？超大视频怎么处理？

A：API接口单文件硬性上限50MB，超规格视频可通过分段剪辑后分次上传解析，或提取视频关键帧+音频脚本文本输入M3，可完整还原视频内容信息。

Q7：已经在用Cursor接入其他大模型，切换成MiniMax M3需要改动大量代码吗？

A：无需修改业务代码，仅替换原有API_KEY与接口地址，M3兼容Anthropic全套SDK协议，IDE插件一键替换配置即可完成切换。

八、总结

MiniMax M3作为国产首款集齐前沿编程、百万超长上下文、原生全模态三大核心能力的开源旗舰大模型，依托自研MSA稀疏注意力架构实现底层技术突破，打破海外头部闭源模型在前沿综合能力领域的垄断格局，产品兼顾云端商用与本地开源两种落地形态，在软件工程开发、政企智能办公、科研创作等多场景落地具备极强实用性，对比同价位竞品在综合能力、部署灵活性、调用成本上优势突出，配套MiniMax Code桌面智能体进一步拓宽AI落地边界，兼顾个人开发者轻量化试用与大型企业私有化合规部署需求，是国产大模型从单点能力突破走向全栈综合化落地的代表性产品。

国产大模型

打赏

版权及免责申明：本文由@AI工具集原创发布。该文章观点仅代表作者本人，不代表本站立场。本站不承担任何相关法律责任。

如若转载，请注明出处：https://www.aipuzi.cn/ai-news/minimax-m3.html

THE END

AI工具集

工具不孤岛，AI集大成——这里有你要的一切智能解法

+ 关注

MiniMax M3：MiniMax推出的百万 Token 全模态国产旗舰大模型

文章目录

一、MiniMax M3是什么

二、功能特色

2.1 旗舰级工程编程与自主智能体能力

2.2 100万Token超大上下文记忆窗口

2.3 原生一体化多模态理解能力

2.4 分层计费与灵活部署双模式

2.5 极低模型幻觉与商用稳定性

三、技术细节

3.1 模型基础架构参数

3.2 MSA稀疏注意力核心技术原理

3.3 推理与工程优化细节

3.4 配套MiniMax Code智能体技术底座

四、应用场景

4.1 软件开发与IT研发场景

4.2 政企数字化智能办公场景

4.3 科研学术场景

4.4 设计与内容创作场景

4.5 智能Agent产品二次开发

4.6 个人日常使用

五、使用方法

5.1 方式一：云端API在线调用（推荐新手/企业商用）

步骤1：平台注册与密钥申请

步骤2：两种代码接入示例

① Python Anthropic SDK适配调用（主流开发方案）

② CURL原生HTTP接口调用

步骤3：套餐选择

5.2 方式二：IDE编程插件接入

5.3 方式三：本地私有化部署（权重开源后）

六、竞品对比

七、常见问题解答

八、总结

相关文章