FlashVSR:开源实时视频超分辨率框架,基于扩散模型实现高效高画质视频增强
FlashVSR 是一款开源的基于扩散模型的实时视频超分辨率框架,主打高效性、可扩展性与高保真度,创新性提出三阶段蒸馏管道与局部约束稀疏注意力机制,解决传统扩散模型视频超...
FlashVSR 是一款开源的基于扩散模型的实时视频超分辨率框架,主打高效性、可扩展性与高保真度,创新性提出三阶段蒸馏管道与局部约束稀疏注意力机制,解决传统扩散模型视频超...
MotionEdit是由腾讯AI(西雅图)与加州大学洛杉矶分校联合开发的开源运动中心图像编辑项目,包含MotionEdit-Bench专用基准数据集与MotionNFT(Motion-guided Negative-awar...
本文AI铺子将带你从零开始,逐步揭开联邦学习(Federated Learning,)的神秘面纱,深入理解其基本原理、核心架构、典型类型与实际应用场景,助你快速掌握这一前沿技术的基础...
Wan-Move是由阿里通义实验室、清华大学、香港大学及香港中文大学等联合开源的运动可控视频生成框架,是人工智能领域顶会NeurIPS 2025的收录研究成果,核心定位是解决传统图...
Kaleido是由智谱AI、合肥工业大学、清华大学等机构联合研发的开源多主体参考视频生成模型,该模型支持512P分辨率视频生成,提供完整的训练、推理代码及预训练权重,适配Pyt...
本文围绕欠拟合这一机器学习与深度学习中的关键概念展开详细探讨。首先明确欠拟合的定义,通过直观示例帮助读者理解其本质。接着深入剖析造成欠拟合的主要原因,涵盖模型复...
Keye-VL是快手Keys团队面向多模态AI领域开源的高性能多模态大语言模型(VLM),全称为Kwai Keye-VL,是快手先进AI技术生态中的核心开源项目。该项目并非单一模型,而是包含...
LongCat-Image是美团LongCat团队开源的一款轻量级双语(中英文)图像生成与编辑基础模型,仅6B参数却具备行业领先的性能表现。该模型不仅能实现高质量文本到图像生成,还支...
Emu3.5是由北京人工智能研究院开源的大规模原生多模态世界模型,其基于单一340亿参数Transformer架构,以“下一状态预测(NSP)”为核心训练目标,在超13万亿多模态Token上...
Flowra是阿里云魔搭(ModelScope)生态下FlowBench平台的核心图形执行引擎与节点包开发工具链,基于Python 3.10+构建,专为AI功能封装与工作流编排场景设计。该项目提供了从节...
