AI Scientist-v2：SakanaAI开源的全流程自主科研智能体系统

原创发布日期：2026-04-07

790

一、AI Scientist-v2是什么

AI Scientist-v2是SakanaAI开发的全链路自主科学研究智能体系统，核心定位是实现从研究构思到论文发表的全流程AI自动化，无需人工介入即可完成科学发现与学术成果产出。该系统最具里程碑意义的成果是：生成了全球首篇完全由AI自主完成、并通过学术同行评审的研讨会论文，被ICLR 2025 workshop收录，标志着AI从科研辅助工具走向独立科研执行者。

与初代AI Scientist-v1相比，v2彻底摆脱对人工编写代码与论文模板的依赖，通过智能体树搜索机制实现开放式科研探索，可在机器学习全领域开展泛化研究，而非局限于固定任务场景，是当前开源社区中自动化程度最高、学术验证最充分的自主科研框架之一。

系统以Python为核心开发语言，基于大模型与多智能体协作架构，兼顾实验执行可靠性、流程可追溯性与学术规范性，可在Linux+NVIDIA GPU环境本地部署，支持自定义模型接入与实验参数配置。

二、功能特色

1. 全流程无人工干预科研自动化

覆盖完整科研闭环：

自主提出研究假设与创新点
调用Semantic Scholar完成文献检索与创新性校验
自动编写实验代码、调试运行、处理异常
数据统计分析与图表可视化生成
按ICML/ICBINB等学术格式撰写完整LaTeX论文
AI审稿人评审+多轮修订优化

2. 无模板约束，跨领域泛化探索

放弃v1版本固定模板机制，支持在机器学习各子领域（小样本学习、优化算法、大模型微调、表征学习等）自由探索，无需针对任务定制代码框架，显著提升适用范围。

3. 渐进式智能体树搜索（核心优势）

采用Best-First Tree Search（BFTS）策略：

多分支并行探索不同实验路径
自动筛选高潜力实验节点，舍弃无效分支
实验失败自动调试修复，支持多轮重试
实验进度管理器统一协调全流程，保证执行稳定

4. 多模型兼容与VLM增强评审

支持OpenAI GPT系列、Google Gemini、AWS Claude等主流大模型
集成视觉-语言模型（VLM）对论文图表、排版、内容逻辑进行反馈优化
可灵活切换模型后端，适配不同算力与精度需求

5. 学术规范输出与流程可追溯

直接生成符合顶会格式的LaTeX论文，包含摘要、引言、实验、结论、参考文献
实验节点树状可视化，完整记录每一步决策与执行结果
内置学术伦理约束，避免低质量、重复或违规研究产出

6. 安全沙箱与可配置化部署

支持Docker隔离运行，降低自动代码执行风险
配置文件统一管理搜索深度、重试次数、模型参数等
提供少样本示例与模板工程，降低上手成本

AI Scientist-v1与v2核心对比

对比维度	AI Scientist-v1	AI Scientist-v2
模板依赖	强依赖人工编写代码/论文模板	完全无模板，自主探索
适用领域	单一固定机器学习任务	全ML领域泛化探索
核心算法	线性执行流程	渐进式智能体树搜索(BFTS)
并行实验	不支持	支持多分支并行探索
VLM评审	无	集成VLM图表与内容评审
学术成果	未通过同行评审	ICLR 2025 workshop接收

三、技术细节

1. 系统架构

AI Scientist-v2采用多智能体协作+树搜索管理架构，核心组件包括：

实验进度管理器（Experiment Progress Manager）：统筹四大实验阶段，调度分支探索与节点筛选
构思智能体：生成研究假设、检索文献、验证创新点
实验智能体：代码生成、环境检测、运行调试、错误修复
分析智能体：数据处理、统计检验、图表绘制
写作智能体：LaTeX论文生成、章节组织、引用排版
AI评审智能体：结合VLM进行学术逻辑、图表质量、格式规范评审

2. 渐进式智能体树搜索流程

初步验证阶段：构建最小可用实验，验证假设可行性
扩展探索阶段：多分支生成不同实验方案，并行执行
筛选优化阶段：按效果评分保留优质节点，修剪低价值分支
论文生成阶段：基于最优实验结果撰写完整学术文稿

3. 代码执行与异常处理

系统自动生成可运行Python代码，具备：

环境自动探测与依赖适配
运行时异常捕获与自动修复
超时控制与资源限制
实验结果持久化与版本管理

核心启动脚本：

python launch_scientist_bfts.py

构思研究方向脚本：

python perform_ideation_temp_free.py

4. 配置与模型接口

核心配置文件bfts_config.yaml控制树搜索深度、并行数、重试次数、模型选择等。
模型接口封装在llm.py与vlm.py，支持API Key环境变量注入，无需修改源码即可切换模型。

四、应用场景

机器学习快速原型验证
研究者输入研究方向，系统自动完成实验设计与验证，快速判断思路可行性。
学术研讨会论文快速产出
自动生成符合规范的workshop级别论文，适用于快速迭代、初步成果发表。
科研教学与实验自动化
用于高校AI相关课程实验，帮助学生理解科研流程，降低代码实现门槛。
企业研发方向探索
企业AI团队用于技术预研、方案对比，批量验证不同算法思路效果。
跨领域机器学习研究
在无先验模板的新领域开展探索，发现传统方法未覆盖的创新点。
论文复现与改进自动化
对已有文献进行复现、消融实验与改进方案自动探索。

AI Scientist-v2：SakanaAI开源的全流程自主科研智能体系统

五、使用方法

1. 环境要求

系统：Linux（推荐Ubuntu 20.04+）
GPU：NVIDIA显卡，支持CUDA 11.7+
Python：3.11
依赖：PyTorch、poppler、chktex、各类大模型SDK

2. 安装步骤

# 创建conda环境
conda create -n ai_scientist python=3.11
conda activate ai_scientist

# 安装PyTorch
conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia

# 安装PDF与LaTeX工具
conda install anaconda::poppler
conda install conda-forge::chktex

# 克隆仓库并安装依赖
git clone https://github.com/SakanaAI/AI-Scientist-v2.git
cd AI-Scientist-v2
pip install -r requirements.txt

3. 配置API密钥

在终端或.env文件设置：

export OPENAI_API_KEY="your-key"
export GEMINI_API_KEY="your-key"
export S2_API_KEY="your-key" # 文献检索

4. 运行流程

生成研究思路：

python perform_ideation_temp_free.py --topic "LLM efficient fine-tuning"

启动全流程科研：

python launch_scientist_bfts.py --config bfts_config.yaml

查看输出：论文与实验数据保存在output/目录，包含完整LaTeX工程与图表。

5. 安全建议

强烈建议在Docker容器中运行，避免自动生成代码对主机造成风险。

六、竞品对比

当前主流AI科研工具与AI Scientist-v2对比：

产品	自动化程度	模板依赖	实验执行	论文评审	开源可部署
AI Scientist-v2	全流程自主	无	代码自动编写运行	VLM+学术评审	是
OpenAI Deep Research	文献+总结	无	无代码执行	基础反馈	否
Google AI Co-Scientist	辅助协作	部分依赖	有限执行	人工主导	否
Perplexity Research	知识检索	无	无	无	否
AI Scientist-v1	流程化	强依赖	固定模板	简单反馈	是

核心差异：AI Scientist-v2是唯一具备完整代码实验执行、树搜索探索、VLM增强学术评审、开源本地部署且通过同行评审的自主科研系统，其他工具多停留在文献整理与内容生成层面，不具备真实科学实验能力。

七、常见问题解答

Q：AI Scientist-v2可以在Windows/macOS上运行吗？

A：官方仅支持Linux环境，Windows可通过WSL2或Docker部署，macOS无CUDA时无法加速实验，不推荐使用。

Q：运行系统需要什么配置的GPU？

A：建议至少16GB显存GPU（如RTX 3090/4090、A10等），小实验可在12GB显存运行，复杂并行实验需更大显存。

Q：必须使用OpenAI/Gemini等API吗？可以用本地大模型吗？

A：官方默认支持云端API，可通过修改llm.py接入本地LLaMA、Qwen等开源模型，但需要自行适配接口与提示词。

Q：生成的论文可以直接投顶会主会吗？

A：当前系统能力主要支持workshop级别论文，主会论文仍需人工补充深度实验、理论分析与更严谨的论证。

Q：系统运行时会自动联网吗？有安全风险吗？

A：会调用文献检索API与模型API，自动生成代码可能包含网络请求，建议在隔离环境运行，避免泄露敏感信息。

Q：实验失败或卡住如何处理？

A：可调整bfts_config.yaml中的重试次数、搜索深度，降低并行数，或检查API密钥与网络状态，日志保存在运行目录便于排查。

Q：可以自定义论文格式与研究领域吗？

A：支持添加自定义LaTeX模板，研究领域可通过输入主题自由指定，系统会适配领域术语与实验范式。

Q：该项目有商用限制吗？

A：采用定制开源协议，禁止用于监控、医疗诊断、犯罪预测等场景，发表论文必须标注AI生成，衍生作品需附带原协议。

八、相关链接

项目GitHub仓库：https://github.com/SakanaAI/AI-Scientist-v2

九、总结

AI Scientist-v2作为SakanaAI推出的开源全流程自主科研智能体，以渐进式智能体树搜索为核心技术，彻底摆脱人工模板限制，实现从研究假设、实验设计、代码执行到论文撰写与评审的完整自动化，其产出的论文成功通过学术同行评审，验证了AI独立开展科学研究的可行性，系统支持多模型接入、跨机器学习领域探索、学术规范输出与本地部署，在开源科研自动化领域具备领先性，既可为研究者提供高效实验验证工具，也为AI科研范式创新提供了可复现的技术框架，同时通过明确的使用约束与安全建议平衡了自动化能力与应用风险，是当前最具实用价值与研究意义的自主科研开源项目之一。

AI科研助手开源项目 AI智能体

打赏

版权及免责申明：本文由@AI工具集原创发布。该文章观点仅代表作者本人，不代表本站立场。本站不承担任何相关法律责任。

如若转载，请注明出处：https://www.aipuzi.cn/ai-news/ai-scientist-v2.html

THE END

AI工具集

工具不孤岛，AI集大成——这里有你要的一切智能解法

+ 关注

AI Scientist-v2：SakanaAI开源的全流程自主科研智能体系统

文章目录

一、AI Scientist-v2是什么

二、功能特色

1. 全流程无人工干预科研自动化

2. 无模板约束，跨领域泛化探索

3. 渐进式智能体树搜索（核心优势）

4. 多模型兼容与VLM增强评审

5. 学术规范输出与流程可追溯

6. 安全沙箱与可配置化部署

AI Scientist-v1与v2核心对比

三、技术细节

1. 系统架构

2. 渐进式智能体树搜索流程

3. 代码执行与异常处理

4. 配置与模型接口

四、应用场景

五、使用方法

1. 环境要求

2. 安装步骤

3. 配置API密钥

4. 运行流程

5. 安全建议

六、竞品对比

七、常见问题解答

八、相关链接

九、总结

相关文章