人工智能研究所的个人主页

ArcReel：开源AI多智能体视频工作台，小说全自动生成短剧分镜与成片

ArcReel 是一款开源AI视频工作台，基于Claude Agent多智能体，小说一键生成分镜、角色、视频，兼容火山方舟、OpenAI、Gemini，Docker私有化部署，支持剪映草稿导出，自媒体...

2周前人工智能研究所

91

SemanticAudio：分层语义空间AI音频框架，支持零训练文本引导音效修改

SemanticAudio是分层Flow Matching架构AI音频生成框架，独立语义空间提升文本音效匹配度，支持零训练音频修改，对比AudioLDM音质与语义对齐效果更强，提供在线音效试听Demo...

2周前人工智能研究所

75

LiveWorld：浙大与阿德莱德大学等联合开源的解耦式视频世界模型

LiveWorld 是阿德莱德大学、浙江大学、澳大利亚国立大学等多校联合团队发布的解耦式生成视频世界模型，项目配套自研行业首个针对视野外动态评测的基准数据集 LiveBench，用...

3周前人工智能研究所

85

VS Code Copilot 接入 DeepSeek API 完整实操教程

本文分享 VS Code Copilot 替换 DeepSeek API 完整实操步骤，无需付费 Copilot，教你配置 API 密钥、插件安装、接口调试、报错排查，低成本实现本地代码补全、代码解释、AI...

3周前人工智能研究所

512

RubyLLM：Ruby开源大模型统一封装库，跨厂商AI接口标准化调用工具

RubyLLM是开源Ruby Gem库，统一封装OpenAI、Gemini、Ollama、DeepSeek等全主流大模型接口，支持对话、多模态、AI Agent、RAG向量，原生适配Rails。

3周前人工智能研究所

81

VibeThinker-3B：新浪微博开源的30亿参数数学算法竞赛推理AI模型

VibeThinker-3B 是新浪微博AI（WeiboAI）团队推出的3B参数轻量化专用推理大模型，基于Qwen2.5-Coder-3B基座微调训练，2026年6月16日开源发布，遵循MIT开源协议，支持免费商...

3周前人工智能研究所

86

Ornith-1.0：DeepReinforce开源的自主规划式AI编码Agent模型

Ornith-1.0是面向Agentic Coding的开源大模型家族，包含9B/31B稠密、35B/397B MoE多规格，自研Self-Scaffolding自脚手架训练框架，在SWE-Bench、Terminal-Bench超越Claude ...

3周前人工智能研究所

153

FastContext：微软开源的大模型代码检索增强AI智能体

FastContext是微软开源专用代码检索子Agent，支持并行仓库检索、精简上下文输出，配套SWE-bench评测与专用检索模型，可集成AI编程助手、自动化代码修复工具，附完整使用教程...

3周前人工智能研究所

103

HappyHorse 1.1：阿里自研AI音视频生成大模型，多参考图锁定主体与原生音画同步创作

HappyHorse 1.1 是阿里巴巴 ATH 事业群 AI 创新事业部自研的国产多模态音视频联合生成大模型，为 HappyHorse 1.0 的迭代升级版本，模型基础参数150亿，主打文生视频、图生视...

4周前人工智能研究所

107

方舟CLI：火山方舟推出的跨平台AI服务自动化命令行管理工具

方舟CLI（Ark CLI）是火山引擎火山方舟大模型服务平台官方推出的命令行运维工具，统一执行命令别名arkcli，依托火山方舟MaaS底座，面向开发者、运维人员、自动化流水线工程...

4周前人工智能研究所

156

人工智能研究所

文章

工具

软件

图书

ArcReel：开源AI多智能体视频工作台，小说全自动生成短剧分镜与成片

SemanticAudio：分层语义空间AI音频框架，支持零训练文本引导音效修改

LiveWorld：浙大与阿德莱德大学等联合开源的解耦式视频世界模型

VS Code Copilot 接入 DeepSeek API 完整实操教程

RubyLLM：Ruby开源大模型统一封装库，跨厂商AI接口标准化调用工具

VibeThinker-3B：新浪微博开源的30亿参数数学算法竞赛推理AI模型

Ornith-1.0：DeepReinforce开源的自主规划式AI编码Agent模型

FastContext：微软开源的大模型代码检索增强AI智能体

HappyHorse 1.1：阿里自研AI音视频生成大模型，多参考图锁定主体与原生音画同步创作

方舟CLI：火山方舟推出的跨平台AI服务自动化命令行管理工具