RealVideo:智谱AI开源的实时流媒体对话视频生成系统
RealVideo 是由智谱 AI 主导开发并开源的实时流媒体对话视频生成系统,采用 Python 编程语言开发,依托 WebSocket 技术实现客户端与服务端的双向实时通信,融合大语言模型与...
RealVideo 是由智谱 AI 主导开发并开源的实时流媒体对话视频生成系统,采用 Python 编程语言开发,依托 WebSocket 技术实现客户端与服务端的双向实时通信,融合大语言模型与...
Cuty AI 是一个集成了世界领先AI模型的全能内容生成平台,致力于为用户提供从文本到图像、从静态图到动态视频的一站式AI创作解决方案。平台整合了包括 Google Veo、OpenAI ...
Kaleido是由智谱AI、合肥工业大学、清华大学等机构联合研发的开源多主体参考视频生成模型,该模型支持512P分辨率视频生成,提供完整的训练、推理代码及预训练权重,适配Pyt...
BeatViz AI 是一款基于先进生成式人工智能技术的一站式AI音乐视频生成平台,专为音乐创作者、内容生产者和品牌营销团队设计。它能够将音频文件或纯文本提示(text prompt)...
LuoGen-agent 是 LuoGen-AI 团队开源的商业级爆款视频自动化生成智能体,集成智能文案处理、高保真语音克隆、数字人口播合成、多平台自动发布等全流程能力,基于 Whisper、...
Loova是一款以“多模型集成”为核心的AI生成平台,聚焦于图片与视频的智能化创作,旨在通过整合全球领先的AI生成模型,为用户提供“一站式”创作解决方案。无论是将文字描述...
STARFlow-V 是苹果团队研发的首款基于归一化流的因果视频生成模型,打破了视频生成领域扩散模型的技术垄断。该模型采用全局 - 局部架构实现时空特征解耦,结合流分数匹配去...
360智图是360推出的一款综合性AI图片视频创作平台,依托先进的生成式人工智能技术,整合图片处理、视频生成、素材资源等核心服务,打造从图片编辑到视频创作的全链路创意生...
12月1日,拍我AI(PixVerse)正式推出V5.5版本,国内首次应用Diffusion与Transformer混合架构,将视频生成速度与质量同步提升。该版本实现了毫秒级音画对口型同步,标志着A...
可灵AI公司今日正式宣布,其自主研发的全球首个统一多模态视频大模型O1于零时起面向公众全量开放。该模型凭借MVL(多模态视觉语言)统一交互架构与Chain-of-Thought推理链路...
Vidi2是字节跳动智能创作与编辑团队研发的开源大型多模态视频理解与生成模型,作为初代Vidi的迭代升级版本,新增细粒度时空定位(STG)和视频问答(Video QA)核心能力,可...
InfiniteTalk是由美团视觉智能团队开源的音频驱动视频生成框架,专为稀疏帧视频配音(Sparse-Frame Video Dubbing)设计,同时支持图像到视频(Image-to-Video)和视频到视...
Runway 是一家致力于将人工智能与艺术创作深度融合的前沿科技公司,总部位于美国,汇聚了来自全球的顶尖研究人员、工程师、艺术家和设计师。其核心技术围绕 生成式AI(Gene...
ChronoEdit是英伟达NVIDIA多伦多AI实验室(nv-tlabs)开发的开源图像编辑与世界模拟工具,核心创新在于将传统图像编辑重构为视频生成任务——以输入图像和目标编辑图像作为...
AutoGLM 是由智谱AI推出的新一代生成式AI智能体平台,代号“小凹”,其融合了多模态理解与生成能力,实现从一句话输入到多种高质量内容输出的全流程自动化。AutoGLM 不仅具...