LaVie:开源AI文生视频框架,支持插值和超分辨率
LaVie 是一个基于 PyTorch 实现的AI文生视频框架,它是视频生成系统 Vchitect 的核心组成部分。LaVie 旨在通过深度学习模型,将用户输入的自然语言文本转化为高质量的视频内...
LaVie 是一个基于 PyTorch 实现的AI文生视频框架,它是视频生成系统 Vchitect 的核心组成部分。LaVie 旨在通过深度学习模型,将用户输入的自然语言文本转化为高质量的视频内...
Linly-Dubbing是一款开源的多语言AI视频配音和翻译工具,旨在通过先进的AI技术实现高质量的视频内容本地化。它能自动下载视频、翻译字幕、分离人声、克隆音色配音并合成视频...
AutoAgent是由香港大学数据智能实验室(HKUDS)开发的一款零代码、全自动化的大型语言模型(LLM)智能体框架,其核心理念是"让AI开发无门槛"。该项目旨在通过纯自然语言交互,让...
AI-Media2Doc是一款基于Web的开源创作工具,它利用AI大模型技术将视频和音频内容智能转换为多种风格的文档形式。与传统的音视频转文字工具不同,AI-Media2Doc不仅提供基础的...
Orca Browser是由加州大学圣地亚哥分校(UCSD)研究团队于2025年9月发布的全球首个智能体浏览器,其核心理念是通过空间化画布和多智能体协同彻底重构传统浏览器的单页面线性...
Kilo Code是一款开源的VS Code扩展程序,定位为"AI编程助手",旨在通过人工智能技术提升开发者的编码效率和质量。作为Cline和Roo Code项目的"超集"继承者,Kilo Code不仅整...
Parlant是由emcie-co团队开发的开源AI智能体框架,专注于指令遵循可靠性,旨在解决大语言模型(LLM)在真实场景中行为不可控的核心痛点。Parlant通过自然语言规则(Guideli...
2025年9月5日至8日,重庆国际博览中心内人潮涌动,2025世界智能产业博览会在此掀起一场“人机共舞”的科技狂欢。全球600余家企业携3000余项智能成果亮相,其中最耀眼的明星...
OpenAI Translator是一个基于ChatGPT API的开源翻译工具,它结合了浏览器插件和跨平台桌面应用两种形式,为用户提供高效、智能的多语言翻译服务。其利用大型语言模型(LLMs...
Youtu-Agent 是腾讯优图实验室开源的一款AI智能体开发框架,旨在帮助开发者轻松构建、运行和评估自主 AI 智能体。该框架完全基于开源生态构建,不依赖任何闭源模型,并通过...