AgentCPM-Report:开源离线AI深度研究报告生成工具,本地部署生成专业长文报告
AgentCPM-Report是一款聚焦于深度研究报告生成的开源大语言模型代理(LLM Agent),由清华大学自然语言处理实验室(THUNLP)、中国人民大学RUCBM实验室与ModelBest联合研发...
AgentCPM-Report是一款聚焦于深度研究报告生成的开源大语言模型代理(LLM Agent),由清华大学自然语言处理实验室(THUNLP)、中国人民大学RUCBM实验室与ModelBest联合研发...
VerseCrafter是由复旦大学、香港大学与腾讯ARC Lab联合研发的开源动态真实视频世界模型,核心突破传统视频生成的几何不可控瓶颈,实现对相机运动、多目标3D轨迹及二者协同关...
Voice-Pro是一款基于Python开发的AI驱动型语音处理网页应用,集成Whisper、F5-TTS、Demucs等主流模型,提供语音识别、零样本语音克隆、多语言文本转语音、音频分离、YouTub...
本文提供EchoMimicV3完整部署教程,涵盖Ubuntu + CUDA环境配置、Python虚拟环境搭建、模型权重下载与路径修改、app_mm.py运行等全流程步骤,助你快速实现蚂蚁集团开源的高效...
PromptX(Prompt Manager)是一款面向AI时代的轻量级开源提示词管理工具,其具备智能分类、版本追踪、快速检索、跨平台适配等专业能力的管理系统,适配个人开发者、AI创作爱...
qqr(也称作hilichurl)是由阿里巴巴自然语言处理(NLP)团队开源的一款轻量级、非侵入式的开放式智能体训练扩展工具,核心开发语言为Python。该工具以slime为基础进行构建...
本文专为零基础用户精心打造,无需编程经验。结合 ComfyUI 可视化界面与 Wan2.2-Animate-14B 模型,轻松实现图片角色替换与动作模仿。从部署到生成,图文详解全流程,助你快...
GLM-Image是由智谱AI与华为联合开源的工业级多模态图像生成模型,也是国内首个全程基于国产昇腾算力完成训练的SOTA级图像生成模型。该模型采用“90亿参数自回归生成器+70亿...
DeepTutor 是由香港大学数据科学实验室(HKUDS) 开源的一款AI 驱动的个性化学习助手,核心定位是解决学习者在自学过程中遇到的 “资料太多找不到答案、复杂概念看不懂、学...
DeepSeek-OCR本地部署指南:仅需16G显存,手把手教你搭建支持高分辨率文档识别的OCR系统,含Conda环境、模型下载、Gradio可视化全流程。
