OmniShow:字节跳动和香港中文大学等联合开源的全模态人-物交互视频生成模型
OmniShow是由字节跳动、香港中文大学、莫纳什大学、香港大学联合研发并开源的端到端多模态人-物交互视频生成(HOIVG)统一模型。它是业界首个完整支持RAP2V的单架构模型,以...
OmniShow是由字节跳动、香港中文大学、莫纳什大学、香港大学联合研发并开源的端到端多模态人-物交互视频生成(HOIVG)统一模型。它是业界首个完整支持RAP2V的单架构模型,以...
想本地体验 Animate Anyone 的 AI 动画生成?这份教程从硬件要求、环境搭建到最终出效果全讲透,步骤清晰无复杂代码,新手也能学会,还附常见报错解决方案,帮你轻松跑通工...
想部署 AniTalker 却怕复杂配置?这篇保姆级指南帮你解决!无需技术基础,从下载安装到导入肖像、启动交互一步到位,跟着点鼠标就能拥有会对话的虚拟形象,附常见问题解决办...
Multica是一款开源的托管智能体平台,核心定位是将AI编程智能体转化为可自主协作的团队成员,支持任务全生命周期管理、技能沉淀复用、多智能体协同与本地安全执行,提供云端...
PokeClaw(PocketClaw)是一款开源的Android端侧AI手机智能体,基于Kotlin开发,主打本地优先运行、隐私安全保护,内置Gemma大模型实现手机屏幕读取、应用操作、跨APP任务自...
PixVerse C1是爱诗科技发布的全球首个影视行业大模型,定位为垂直深耕影视工业化流程的专业AI视频生成工具。该模型支持文生视频、图生视频、首尾帧控制、参考生成四大核心模...
Seeduplex是字节跳动基于Seed基座研发的行业首个规模化落地原生全双工语音大模型,实现倾听、理解、生成、输出同步并行,端到端延迟低至500ms内,支持实时打断、精准抗干扰...
本文深度解析 LangChain 核心概念与架构,涵盖 Model I/O、Chains、Memory、Agents 六大模块。通过实战代码教你从零构建聊天机器人、RAG 知识库及智能 Agent,是大模型开发...
LifeSim是复旦大学团队开源的长周期用户生活模拟器,基于信念-愿望-意图(BDI)认知模型构建,可生成连贯真实的用户人生轨迹与交互行为,配套推出LifeSim-Eval评测基准,解...
Rowboat是由Rowboat Labs开发、Y Combinator孵化的开源本地优先AI协作工具,核心是将用户邮件、会议笔记等工作内容转化为可编辑、可检索的Markdown知识图谱,所有数据本地存...
