AI Scientist-v2:SakanaAI开源的全流程自主科研智能体系统

原创 发布日期:
63

一、AI Scientist-v2是什么

AI Scientist-v2是SakanaAI开发的全链路自主科学研究智能体系统,核心定位是实现从研究构思到论文发表的全流程AI自动化,无需人工介入即可完成科学发现与学术成果产出。该系统最具里程碑意义的成果是:生成了全球首篇完全由AI自主完成、并通过学术同行评审的研讨会论文,被ICLR 2025 workshop收录,标志着AI从科研辅助工具走向独立科研执行者。

与初代AI Scientist-v1相比,v2彻底摆脱对人工编写代码与论文模板的依赖,通过智能体树搜索机制实现开放式科研探索,可在机器学习全领域开展泛化研究,而非局限于固定任务场景,是当前开源社区中自动化程度最高、学术验证最充分的自主科研框架之一。

系统以Python为核心开发语言,基于大模型与多智能体协作架构,兼顾实验执行可靠性、流程可追溯性与学术规范性,可在Linux+NVIDIA GPU环境本地部署,支持自定义模型接入与实验参数配置。

二、功能特色

1. 全流程无人工干预科研自动化

覆盖完整科研闭环:

  • 自主提出研究假设与创新点

  • 调用Semantic Scholar完成文献检索与创新性校验

  • 自动编写实验代码、调试运行、处理异常

  • 数据统计分析与图表可视化生成

  • 按ICML/ICBINB等学术格式撰写完整LaTeX论文

  • AI审稿人评审+多轮修订优化

2. 无模板约束,跨领域泛化探索

放弃v1版本固定模板机制,支持在机器学习各子领域(小样本学习、优化算法、大模型微调、表征学习等)自由探索,无需针对任务定制代码框架,显著提升适用范围。

3. 渐进式智能体树搜索(核心优势)

采用Best-First Tree Search(BFTS)策略:

  • 多分支并行探索不同实验路径

  • 自动筛选高潜力实验节点,舍弃无效分支

  • 实验失败自动调试修复,支持多轮重试

  • 实验进度管理器统一协调全流程,保证执行稳定

4. 多模型兼容与VLM增强评审

  • 支持OpenAI GPT系列、Google Gemini、AWS Claude等主流大模型

  • 集成视觉-语言模型(VLM)对论文图表、排版、内容逻辑进行反馈优化

  • 可灵活切换模型后端,适配不同算力与精度需求

5. 学术规范输出与流程可追溯

  • 直接生成符合顶会格式的LaTeX论文,包含摘要、引言、实验、结论、参考文献

  • 实验节点树状可视化,完整记录每一步决策与执行结果

  • 内置学术伦理约束,避免低质量、重复或违规研究产出

6. 安全沙箱与可配置化部署

  • 支持Docker隔离运行,降低自动代码执行风险

  • 配置文件统一管理搜索深度、重试次数、模型参数等

  • 提供少样本示例与模板工程,降低上手成本

AI Scientist-v1与v2核心对比

对比维度 AI Scientist-v1 AI Scientist-v2
模板依赖 强依赖人工编写代码/论文模板 完全无模板,自主探索
适用领域 单一固定机器学习任务 全ML领域泛化探索
核心算法 线性执行流程 渐进式智能体树搜索(BFTS)
并行实验 不支持 支持多分支并行探索
VLM评审 集成VLM图表与内容评审
学术成果 未通过同行评审 ICLR 2025 workshop接收

三、技术细节

1. 系统架构

AI Scientist-v2采用多智能体协作+树搜索管理架构,核心组件包括:

  • 实验进度管理器(Experiment Progress Manager):统筹四大实验阶段,调度分支探索与节点筛选

  • 构思智能体:生成研究假设、检索文献、验证创新点

  • 实验智能体:代码生成、环境检测、运行调试、错误修复

  • 分析智能体:数据处理、统计检验、图表绘制

  • 写作智能体:LaTeX论文生成、章节组织、引用排版

  • AI评审智能体:结合VLM进行学术逻辑、图表质量、格式规范评审

2. 渐进式智能体树搜索流程

  1. 初步验证阶段:构建最小可用实验,验证假设可行性

  2. 扩展探索阶段:多分支生成不同实验方案,并行执行

  3. 筛选优化阶段:按效果评分保留优质节点,修剪低价值分支

  4. 论文生成阶段:基于最优实验结果撰写完整学术文稿

3. 代码执行与异常处理

系统自动生成可运行Python代码,具备:

  • 环境自动探测与依赖适配

  • 运行时异常捕获与自动修复

  • 超时控制与资源限制

  • 实验结果持久化与版本管理

核心启动脚本:

python launch_scientist_bfts.py

构思研究方向脚本:

python perform_ideation_temp_free.py

4. 配置与模型接口

核心配置文件bfts_config.yaml控制树搜索深度、并行数、重试次数、模型选择等。
模型接口封装在llm.pyvlm.py,支持API Key环境变量注入,无需修改源码即可切换模型。

四、应用场景

  1. 机器学习快速原型验证
    研究者输入研究方向,系统自动完成实验设计与验证,快速判断思路可行性。

  2. 学术研讨会论文快速产出
    自动生成符合规范的workshop级别论文,适用于快速迭代、初步成果发表。

  3. 科研教学与实验自动化
    用于高校AI相关课程实验,帮助学生理解科研流程,降低代码实现门槛。

  4. 企业研发方向探索
    企业AI团队用于技术预研、方案对比,批量验证不同算法思路效果。

  5. 跨领域机器学习研究
    在无先验模板的新领域开展探索,发现传统方法未覆盖的创新点。

  6. 论文复现与改进自动化
    对已有文献进行复现、消融实验与改进方案自动探索。

AI Scientist-v2:SakanaAI开源的全流程自主科研智能体系统

五、使用方法

1. 环境要求

  • 系统:Linux(推荐Ubuntu 20.04+)

  • GPU:NVIDIA显卡,支持CUDA 11.7+

  • Python:3.11

  • 依赖:PyTorch、poppler、chktex、各类大模型SDK

2. 安装步骤

# 创建conda环境
conda create -n ai_scientist python=3.11
conda activate ai_scientist

# 安装PyTorch
conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia

# 安装PDF与LaTeX工具
conda install anaconda::poppler
conda install conda-forge::chktex

# 克隆仓库并安装依赖
git clone https://github.com/SakanaAI/AI-Scientist-v2.git
cd AI-Scientist-v2
pip install -r requirements.txt

3. 配置API密钥

在终端或.env文件设置:

export OPENAI_API_KEY="your-key"
export GEMINI_API_KEY="your-key"
export S2_API_KEY="your-key" # 文献检索

4. 运行流程

  1. 生成研究思路:

python perform_ideation_temp_free.py --topic "LLM efficient fine-tuning"
  1. 启动全流程科研:

python launch_scientist_bfts.py --config bfts_config.yaml
  1. 查看输出:论文与实验数据保存在output/目录,包含完整LaTeX工程与图表。

5. 安全建议

强烈建议在Docker容器中运行,避免自动生成代码对主机造成风险。

六、竞品对比

当前主流AI科研工具与AI Scientist-v2对比:

产品 自动化程度 模板依赖 实验执行 论文评审 开源可部署
AI Scientist-v2 全流程自主 代码自动编写运行 VLM+学术评审
OpenAI Deep Research 文献+总结 无代码执行 基础反馈
Google AI Co-Scientist 辅助协作 部分依赖 有限执行 人工主导
Perplexity Research 知识检索
AI Scientist-v1 流程化 强依赖 固定模板 简单反馈

核心差异:AI Scientist-v2是唯一具备完整代码实验执行、树搜索探索、VLM增强学术评审、开源本地部署且通过同行评审的自主科研系统,其他工具多停留在文献整理与内容生成层面,不具备真实科学实验能力。

七、常见问题解答

Q:AI Scientist-v2可以在Windows/macOS上运行吗?

A:官方仅支持Linux环境,Windows可通过WSL2或Docker部署,macOS无CUDA时无法加速实验,不推荐使用。

Q:运行系统需要什么配置的GPU?

A:建议至少16GB显存GPU(如RTX 3090/4090、A10等),小实验可在12GB显存运行,复杂并行实验需更大显存。

Q:必须使用OpenAI/Gemini等API吗?可以用本地大模型吗?

A:官方默认支持云端API,可通过修改llm.py接入本地LLaMA、Qwen等开源模型,但需要自行适配接口与提示词。

Q:生成的论文可以直接投顶会主会吗?

A:当前系统能力主要支持workshop级别论文,主会论文仍需人工补充深度实验、理论分析与更严谨的论证。

Q:系统运行时会自动联网吗?有安全风险吗?

A:会调用文献检索API与模型API,自动生成代码可能包含网络请求,建议在隔离环境运行,避免泄露敏感信息。

Q:实验失败或卡住如何处理?

A:可调整bfts_config.yaml中的重试次数、搜索深度,降低并行数,或检查API密钥与网络状态,日志保存在运行目录便于排查。

Q:可以自定义论文格式与研究领域吗?

A:支持添加自定义LaTeX模板,研究领域可通过输入主题自由指定,系统会适配领域术语与实验范式。

Q:该项目有商用限制吗?

A:采用定制开源协议,禁止用于监控、医疗诊断、犯罪预测等场景,发表论文必须标注AI生成,衍生作品需附带原协议。

八、相关链接

九、总结

AI Scientist-v2作为SakanaAI推出的开源全流程自主科研智能体,以渐进式智能体树搜索为核心技术,彻底摆脱人工模板限制,实现从研究假设、实验设计、代码执行到论文撰写与评审的完整自动化,其产出的论文成功通过学术同行评审,验证了AI独立开展科学研究的可行性,系统支持多模型接入、跨机器学习领域探索、学术规范输出与本地部署,在开源科研自动化领域具备领先性,既可为研究者提供高效实验验证工具,也为AI科研范式创新提供了可复现的技术框架,同时通过明确的使用约束与安全建议平衡了自动化能力与应用风险,是当前最具实用价值与研究意义的自主科研开源项目之一。

打赏
THE END
作者头像
AI工具集
工具不孤岛,AI集大成——这里有你要的一切智能解法