PaperBanana:北大联合谷歌开源的学术插图自动生成框架
PaperBanana是由北京大学与谷歌云AI研究院联合研发的开源智能体框架,核心定位是为AI科学家及科研工作者提供出版级学术插图的全自动化生成服务,解决科研过程中方法流程图、...
PaperBanana是由北京大学与谷歌云AI研究院联合研发的开源智能体框架,核心定位是为AI科学家及科研工作者提供出版级学术插图的全自动化生成服务,解决科研过程中方法流程图、...
ACE-Step 1.5是一款由ACE Studio与StepFun联合开发的开源音乐生成基础模型,主打在消费级硬件上实现商用级别的音乐生成能力,仅需4GB显存即可本地运行,兼具极速生成、多语...
OpenClaw 飞书机器人完整部署指南:Linux 服务器一键安装、App ID 配置、WebSocket 连接、消息事件权限开通与版本发布。支持 Shell 执行与网页自动化,数据完全本地化。
SoulX-FlashTalk是由Soul AI Lab(Soul App人工智能实验室)联合东华大学研发并开源的实时音频驱动数字人无限流式生成模型,核心定位是解决传统数字人生成技术中“高画质必...
腾讯开源视频大模型HunyuanVideo(130B参数)从零部署实战:环境配置、HF模型下载、LLaVA/CLIP文本编码器预处理、Gradio服务启动,附避坑清单与性能实测。
Step 3.5 Flash是阶跃星辰(StepFun)发布的面向智能体(Agent)场景的开源基座大语言模型,采用稀疏混合专家(MoE)架构,总参数量196.81B,每token仅激活约11B参数,在保...
零基础也能会!Moltbot/Clawdbot 安装教程涵盖 Windows/Mac 系统部署、多模型(Claude/GLM/GPT)配置、多平台集成,附常用指令 + 故障排除,手把手搭建 AI 助手。
SkyReels V3是昆仑万维旗下Skywork AI团队自主研发的第三代旗舰多模态视频生成模型,基于统一多模态上下文学习框架与扩散Transformer架构打造,原生集成参考图像生成视频、...
LingBot-World是一款面向交互式世界建模的开源世界模拟器,核心源于视频生成技术,由蚂蚁灵波开发并维护,定位为顶级开源世界模型。它通过从大规模游戏环境中学习物理规律与...
SGLang是一款开源的大模型高性能推理框架,主打低延迟、高吞吐量的模型推理能力,原生支持结构化生成,创新采用RadixAttention技术实现KV缓存高效复用,兼容主流大模型与多...
