新手也能玩转 AI 视频生成:ComfyUI + Wan2.2-Animate-14B 快速入门指南
本文专为零基础用户精心打造,无需编程经验。结合 ComfyUI 可视化界面与 Wan2.2-Animate-14B 模型,轻松实现图片角色替换与动作模仿。从部署到生成,图文详解全流程,助你快...
本文专为零基础用户精心打造,无需编程经验。结合 ComfyUI 可视化界面与 Wan2.2-Animate-14B 模型,轻松实现图片角色替换与动作模仿。从部署到生成,图文详解全流程,助你快...
GLM-Image是由智谱AI与华为联合开源的工业级多模态图像生成模型,也是国内首个全程基于国产昇腾算力完成训练的SOTA级图像生成模型。该模型采用“90亿参数自回归生成器+70亿...
DeepTutor 是由香港大学数据科学实验室(HKUDS) 开源的一款AI 驱动的个性化学习助手,核心定位是解决学习者在自学过程中遇到的 “资料太多找不到答案、复杂概念看不懂、学...
DeepSeek-OCR本地部署指南:仅需16G显存,手把手教你搭建支持高分辨率文档识别的OCR系统,含Conda环境、模型下载、Gradio可视化全流程。
LandPPT 是一款基于大语言模型(LLM)驱动的开源智能 PPT 生成工具,核心解决传统 PPT 制作耗时、专业度要求高的痛点,支持从主题输入或多格式文档上传出发,一键生成包含大...
Qwen3-VL-Embedding 是阿里云通义千问团队重磅开源的高性能多模态嵌入(Embedding)模型,是通义千问 Qwen3 系列大模型的核心分支产品。该模型基于千问自研的多模态大模型基...
XVERSE-Ent是由深圳元象并开源的面向娱乐领域的专用预训练大语言模型系列,基于混合专家(MoE)架构打造,包含中文XVERSE-Ent-A4.2B与英文XVERSE-Ent-A5.7B两款模型。该项目...
Paper2Any是OpenDCAI团队推出的一款开源多模态科研创作辅助工具,支持从论文PDF、截图、文本等多种输入形式,一键生成可编辑的模型架构图、技术路线图、实验数据图等科研绘...
Computer Use Preview 是谷歌开源的 AI 驱动型计算机操作工具,基于 Gemini 大模型实现自然语言指令转浏览器自动化操作。支持本地 Playwright 与 Browserbase 云浏览器双环...
IQuest-Coder-V1是一套专注于代码生成、代码理解与软件工程全流程任务的开源大语言模型系列,由国内量化私募头部机构九坤投资旗下至知创新研究院独立开发并开源。作为聚焦垂...
