AI新闻资讯 - 最新人工智能技术动态与热点资讯

AutoMV：开源多智能体音乐视频生成系统，一键实现全长歌曲到连贯MV的自动化创作

AutoMV是一款基于多智能体架构的开源音乐视频（MV）自动生成系统，无需额外训练即可直接从全长歌曲输出连贯、高质量的长格式MV。该系统整合音乐信号分析、智能脚本编写、角...

2个月前 AI工具箱

118

HY-Motion 1.0：腾讯混元开源的文本到 3D 动作生成模型

HY-Motion 1.0是腾讯混元团队开源的大规模文本到3D人体动作生成模型系列，核心定位是为数字内容创作领域提供高效、高精度的AI驱动动画生成解决方案。它系统性解决了长期困扰...

2个月前人工智能研究所

201

Vibe Kanban：BloopAI 开源的 AI 编码代理看板工具

Vibe Kanban是由BloopAI开源的一款专为开发者设计的AI编码代理协作与项目管理工具，基于看板模式提供可视化任务管理界面。它支持Claude Code、Gemini CLI等主流AI编码代理的...

2个月前 AI工具集

220

ClipSketch AI：开源 AI 驱动的视频转手绘故事板工具

ClipSketch AI是一款专为短视频创作者、二创爱好者和社交媒体运营者设计的开源工具，基于Google Gemini多模态模型构建，支持解析B站、小红书等平台的视频链接，通过帧级标记...

2个月前 AI工具箱

138

Spatia：基于3D场景点云和动态-静态解纠缠的开源视频生成框架

Spatia是一款由悉尼大学、微软研究院等机构联合研发的开源视频生成框架，核心优势在于通过持久化3D场景点云构建可更新的空间记忆，结合动态-静态解纠缠设计，解决了传统视频...

2个月前 AI铺子

98

OmniVCus：多模态控制的开源主题驱动视频生成与编辑框架

OmniVCus是一个开源的视频生成与编辑框架，核心目标是通过多维度的控制条件，实现对视频内容的精准定制——无论是指定主体的动作与场景搭配，还是通过文本指令修改细节、用...

2个月前 97ai

90

VideoRAG：港大开源的长视频智能交互工具，支持数百小时视频自然语言问答

VideoRAG是由香港大学数据科学实验室（HKUDS）开源的一款超长视频跨模态检索增强生成框架，核心定位是实现“Chat with Your Videos”——让用户通过自然语言与任意长度的视...

2个月前 dotaai

145

StoryMem：基于记忆条件控制的开源多镜头长视频生成工具

StoryMem是一款开源的多镜头长视频叙事生成工具，依托记忆条件控制的单镜头视频扩散模型，能够根据含逐镜头文本描述的故事脚本，生成时长约一分钟、角色高度连贯且具备电影...

2个月前 AI工具集

91

ProEdit：中山大学等高校联合开源的 AI 图像视频精准编辑工具

ProEdit是中山大学ISEE实验室联合多所高校研发的开源基于反转的提示词驱动型AI图像与视频编辑工具，核心聚焦传统反转类编辑工具"源信息干扰导致编辑不精准、背景易误伤"的行...

2个月前 AI工具箱

80

Qwen-Doc：阿里通义推出的开源长文档处理与智能推理工具集

Qwen-Doc是由阿里巴巴通义智文团队开发并开源的专注于文档智能的代码库，不同于常规的文档解析工具，Qwen-Doc核心聚焦大语言模型在长文本、复杂文档场景下的能力提升，解决...

2个月前人工智能研究所

107

AI新闻

热门人工智能技术动态与AI行业资讯

AutoMV：开源多智能体音乐视频生成系统，一键实现全长歌曲到连贯MV的自动化创作

HY-Motion 1.0：腾讯混元开源的文本到 3D 动作生成模型

Vibe Kanban：BloopAI 开源的 AI 编码代理看板工具

ClipSketch AI：开源 AI 驱动的视频转手绘故事板工具

Spatia：基于3D场景点云和动态-静态解纠缠的开源视频生成框架

OmniVCus：多模态控制的开源主题驱动视频生成与编辑框架

VideoRAG：港大开源的长视频智能交互工具，支持数百小时视频自然语言问答

StoryMem：基于记忆条件控制的开源多镜头长视频生成工具

ProEdit：中山大学等高校联合开源的 AI 图像视频精准编辑工具

Qwen-Doc：阿里通义推出的开源长文档处理与智能推理工具集