AI Scientist-v2:SakanaAI开源的全流程自主科研智能体系统
一、AI Scientist-v2是什么
AI Scientist-v2是SakanaAI开发的全链路自主科学研究智能体系统,核心定位是实现从研究构思到论文发表的全流程AI自动化,无需人工介入即可完成科学发现与学术成果产出。该系统最具里程碑意义的成果是:生成了全球首篇完全由AI自主完成、并通过学术同行评审的研讨会论文,被ICLR 2025 workshop收录,标志着AI从科研辅助工具走向独立科研执行者。
与初代AI Scientist-v1相比,v2彻底摆脱对人工编写代码与论文模板的依赖,通过智能体树搜索机制实现开放式科研探索,可在机器学习全领域开展泛化研究,而非局限于固定任务场景,是当前开源社区中自动化程度最高、学术验证最充分的自主科研框架之一。
系统以Python为核心开发语言,基于大模型与多智能体协作架构,兼顾实验执行可靠性、流程可追溯性与学术规范性,可在Linux+NVIDIA GPU环境本地部署,支持自定义模型接入与实验参数配置。
二、功能特色
1. 全流程无人工干预科研自动化
覆盖完整科研闭环:
自主提出研究假设与创新点
调用Semantic Scholar完成文献检索与创新性校验
自动编写实验代码、调试运行、处理异常
数据统计分析与图表可视化生成
按ICML/ICBINB等学术格式撰写完整LaTeX论文
AI审稿人评审+多轮修订优化
2. 无模板约束,跨领域泛化探索
放弃v1版本固定模板机制,支持在机器学习各子领域(小样本学习、优化算法、大模型微调、表征学习等)自由探索,无需针对任务定制代码框架,显著提升适用范围。
3. 渐进式智能体树搜索(核心优势)
采用Best-First Tree Search(BFTS)策略:
多分支并行探索不同实验路径
自动筛选高潜力实验节点,舍弃无效分支
实验失败自动调试修复,支持多轮重试
实验进度管理器统一协调全流程,保证执行稳定
4. 多模型兼容与VLM增强评审
支持OpenAI GPT系列、Google Gemini、AWS Claude等主流大模型
集成视觉-语言模型(VLM)对论文图表、排版、内容逻辑进行反馈优化
可灵活切换模型后端,适配不同算力与精度需求
5. 学术规范输出与流程可追溯
直接生成符合顶会格式的LaTeX论文,包含摘要、引言、实验、结论、参考文献
实验节点树状可视化,完整记录每一步决策与执行结果
内置学术伦理约束,避免低质量、重复或违规研究产出
6. 安全沙箱与可配置化部署
支持Docker隔离运行,降低自动代码执行风险
配置文件统一管理搜索深度、重试次数、模型参数等
提供少样本示例与模板工程,降低上手成本
AI Scientist-v1与v2核心对比
| 对比维度 | AI Scientist-v1 | AI Scientist-v2 |
|---|---|---|
| 模板依赖 | 强依赖人工编写代码/论文模板 | 完全无模板,自主探索 |
| 适用领域 | 单一固定机器学习任务 | 全ML领域泛化探索 |
| 核心算法 | 线性执行流程 | 渐进式智能体树搜索(BFTS) |
| 并行实验 | 不支持 | 支持多分支并行探索 |
| VLM评审 | 无 | 集成VLM图表与内容评审 |
| 学术成果 | 未通过同行评审 | ICLR 2025 workshop接收 |
三、技术细节
1. 系统架构
AI Scientist-v2采用多智能体协作+树搜索管理架构,核心组件包括:
实验进度管理器(Experiment Progress Manager):统筹四大实验阶段,调度分支探索与节点筛选
构思智能体:生成研究假设、检索文献、验证创新点
实验智能体:代码生成、环境检测、运行调试、错误修复
分析智能体:数据处理、统计检验、图表绘制
写作智能体:LaTeX论文生成、章节组织、引用排版
AI评审智能体:结合VLM进行学术逻辑、图表质量、格式规范评审
2. 渐进式智能体树搜索流程
初步验证阶段:构建最小可用实验,验证假设可行性
扩展探索阶段:多分支生成不同实验方案,并行执行
筛选优化阶段:按效果评分保留优质节点,修剪低价值分支
论文生成阶段:基于最优实验结果撰写完整学术文稿
3. 代码执行与异常处理
系统自动生成可运行Python代码,具备:
环境自动探测与依赖适配
运行时异常捕获与自动修复
超时控制与资源限制
实验结果持久化与版本管理
核心启动脚本:
python launch_scientist_bfts.py
构思研究方向脚本:
python perform_ideation_temp_free.py
4. 配置与模型接口
核心配置文件bfts_config.yaml控制树搜索深度、并行数、重试次数、模型选择等。
模型接口封装在llm.py与vlm.py,支持API Key环境变量注入,无需修改源码即可切换模型。
四、应用场景
机器学习快速原型验证
研究者输入研究方向,系统自动完成实验设计与验证,快速判断思路可行性。学术研讨会论文快速产出
自动生成符合规范的workshop级别论文,适用于快速迭代、初步成果发表。科研教学与实验自动化
用于高校AI相关课程实验,帮助学生理解科研流程,降低代码实现门槛。企业研发方向探索
企业AI团队用于技术预研、方案对比,批量验证不同算法思路效果。跨领域机器学习研究
在无先验模板的新领域开展探索,发现传统方法未覆盖的创新点。论文复现与改进自动化
对已有文献进行复现、消融实验与改进方案自动探索。

五、使用方法
1. 环境要求
系统:Linux(推荐Ubuntu 20.04+)
GPU:NVIDIA显卡,支持CUDA 11.7+
Python:3.11
依赖:PyTorch、poppler、chktex、各类大模型SDK
2. 安装步骤
# 创建conda环境 conda create -n ai_scientist python=3.11 conda activate ai_scientist # 安装PyTorch conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia # 安装PDF与LaTeX工具 conda install anaconda::poppler conda install conda-forge::chktex # 克隆仓库并安装依赖 git clone https://github.com/SakanaAI/AI-Scientist-v2.git cd AI-Scientist-v2 pip install -r requirements.txt
3. 配置API密钥
在终端或.env文件设置:
export OPENAI_API_KEY="your-key" export GEMINI_API_KEY="your-key" export S2_API_KEY="your-key" # 文献检索
4. 运行流程
生成研究思路:
python perform_ideation_temp_free.py --topic "LLM efficient fine-tuning"
启动全流程科研:
python launch_scientist_bfts.py --config bfts_config.yaml
查看输出:论文与实验数据保存在
output/目录,包含完整LaTeX工程与图表。
5. 安全建议
强烈建议在Docker容器中运行,避免自动生成代码对主机造成风险。
六、竞品对比
当前主流AI科研工具与AI Scientist-v2对比:
| 产品 | 自动化程度 | 模板依赖 | 实验执行 | 论文评审 | 开源可部署 |
|---|---|---|---|---|---|
| AI Scientist-v2 | 全流程自主 | 无 | 代码自动编写运行 | VLM+学术评审 | 是 |
| OpenAI Deep Research | 文献+总结 | 无 | 无代码执行 | 基础反馈 | 否 |
| Google AI Co-Scientist | 辅助协作 | 部分依赖 | 有限执行 | 人工主导 | 否 |
| Perplexity Research | 知识检索 | 无 | 无 | 无 | 否 |
| AI Scientist-v1 | 流程化 | 强依赖 | 固定模板 | 简单反馈 | 是 |
核心差异:AI Scientist-v2是唯一具备完整代码实验执行、树搜索探索、VLM增强学术评审、开源本地部署且通过同行评审的自主科研系统,其他工具多停留在文献整理与内容生成层面,不具备真实科学实验能力。
七、常见问题解答
Q:AI Scientist-v2可以在Windows/macOS上运行吗?
A:官方仅支持Linux环境,Windows可通过WSL2或Docker部署,macOS无CUDA时无法加速实验,不推荐使用。
Q:运行系统需要什么配置的GPU?
A:建议至少16GB显存GPU(如RTX 3090/4090、A10等),小实验可在12GB显存运行,复杂并行实验需更大显存。
Q:必须使用OpenAI/Gemini等API吗?可以用本地大模型吗?
A:官方默认支持云端API,可通过修改llm.py接入本地LLaMA、Qwen等开源模型,但需要自行适配接口与提示词。
Q:生成的论文可以直接投顶会主会吗?
A:当前系统能力主要支持workshop级别论文,主会论文仍需人工补充深度实验、理论分析与更严谨的论证。
Q:系统运行时会自动联网吗?有安全风险吗?
A:会调用文献检索API与模型API,自动生成代码可能包含网络请求,建议在隔离环境运行,避免泄露敏感信息。
Q:实验失败或卡住如何处理?
A:可调整bfts_config.yaml中的重试次数、搜索深度,降低并行数,或检查API密钥与网络状态,日志保存在运行目录便于排查。
Q:可以自定义论文格式与研究领域吗?
A:支持添加自定义LaTeX模板,研究领域可通过输入主题自由指定,系统会适配领域术语与实验范式。
Q:该项目有商用限制吗?
A:采用定制开源协议,禁止用于监控、医疗诊断、犯罪预测等场景,发表论文必须标注AI生成,衍生作品需附带原协议。
八、相关链接
项目GitHub仓库:https://github.com/SakanaAI/AI-Scientist-v2
九、总结
AI Scientist-v2作为SakanaAI推出的开源全流程自主科研智能体,以渐进式智能体树搜索为核心技术,彻底摆脱人工模板限制,实现从研究假设、实验设计、代码执行到论文撰写与评审的完整自动化,其产出的论文成功通过学术同行评审,验证了AI独立开展科学研究的可行性,系统支持多模型接入、跨机器学习领域探索、学术规范输出与本地部署,在开源科研自动化领域具备领先性,既可为研究者提供高效实验验证工具,也为AI科研范式创新提供了可复现的技术框架,同时通过明确的使用约束与安全建议平衡了自动化能力与应用风险,是当前最具实用价值与研究意义的自主科研开源项目之一。
版权及免责申明:本文由@AI工具集原创发布。该文章观点仅代表作者本人,不代表本站立场。本站不承担任何相关法律责任。
如若转载,请注明出处:https://www.aipuzi.cn/ai-news/ai-scientist-v2.html

