AI新闻资讯 - 最新人工智能技术动态与热点资讯

MotionEdit：腾讯 AI 与 UCLA 联合开源的运动感知图像编辑数据集与训练框架

MotionEdit是由腾讯AI（西雅图）与加州大学洛杉矶分校联合开发的开源运动中心图像编辑项目，包含MotionEdit-Bench专用基准数据集与MotionNFT（Motion-guided Negative-awar...

4个月前 AI铺子

105

AnyTalker：香港科技大学开源的音频驱动多人对话视频生成框架

AnyTalker是由香港科技大学研发并开源的一款专注于“音频驱动多人人说话视频生成”的技术框架。不同于传统单一人脸动画生成工具，该框架核心解决了“多人交互场景下视频生成...

4个月前 dotaai

118

Wan-Animate：阿里通义实验室推出的 AI 角色动画生成与视频角色替换框架

Wan-Animate是由阿里通义实验室研发的一款统一角色动画与替换框架，其构建于Wan模型之上，并针对角色动画类任务优化了输入范式与技术架构。作为一款定位 “一体化” 的 AI ...

4个月前 AI工具集

138

LightX2V：轻量级视频生成推理框架，高性能多模态视频合成与高效部署解决方案

LightX2V 是一款轻量级视频生成推理框架，专注于文本到视频（T2V）与图像到视频（I2V）的高效合成任务。该框架整合了当下主流的视频生成技术，通过模型量化、特征缓存、并行...

4个月前 AI工具箱

216

UnityVideo：港科大 & 清华 & 快手可灵联合开源的视频理解与生成框架

UnityVideo 是由香港科技大学、香港中文大学、清华大学与快手可灵联合研发的多模态多任务统一视频理解与生成框架。该框架基于统一 Transformer 骨干网络与联合训练策略，突...

4个月前人工智能研究所

94

LLaDA2.0：蚂蚁集团开源的大参数扩散型生成式 AI 模型

LLaDA2.0 是蚂蚁集团推出的一系列离散扩散大型语言模型（dLLMs），涵盖 16B 参数的基础版本与 100B 参数的混合专家（MoE）版本，是目前参数规模最大的扩散语言模型之一。该...

4个月前人工智能研究所

165

Wan-Move：阿里通义实验室推出的开源运动可控视频生成框架

Wan-Move是由阿里通义实验室、清华大学、香港大学及香港中文大学等联合开源的运动可控视频生成框架，是人工智能领域顶会NeurIPS 2025的收录研究成果，核心定位是解决传统图...

4个月前 AI铺子

163

Paper2Slides：开源论文转幻灯片工具，一键生成专业级演示文稿与学术海报

Paper2Slides是一款开源的自动化内容转换工具，专注于将PDF、Word、Markdown等多格式研究论文、报告类文档一键转换为符合出版级设计标准的幻灯片和学术海报。该工具基于RAG...

4个月前 97ai

244

Claude-Mem：开源 Claude Code 持久化记忆插件，跨会话上下文延续与智能检索工具

Claude-Mem 是一款专为 Claude Code 打造的开源持久化记忆插件，核心目标是解决 AI 代码助手跨会话上下文丢失的痛点。该工具通过钩子架构、混合搜索技术与轻量化数据库存储...