AIMangaStudio:AI 驱动的漫画制作工具,助力创作者从脚本到分镜的全流程
AIMangaStudio 是一个基于 AI 技术的漫画制作工具,旨在帮助创作者快速生成漫画脚本、设计角色、布局分镜,并最终导出完整的漫画作品。本项目集成了 Google GenAI 等先进 A...
AIMangaStudio 是一个基于 AI 技术的漫画制作工具,旨在帮助创作者快速生成漫画脚本、设计角色、布局分镜,并最终导出完整的漫画作品。本项目集成了 Google GenAI 等先进 A...
EchoCare 是一个面向超声临床应用的完全开源基础模型,基于大规模无标注超声影像数据集 EchoAtlas 训练而成。该数据集覆盖全球 5 大洲 23 个临床中心、38 种不同超声设备,...
RoboBrain-X0 是一个突破性的跨实体机器人智能框架,旨在克服单机器人系统在异构实体迁移中的局限性。它通过统一的动作词汇表和先进的动作令牌化技术,实现了在不同机器人平...
Lynx是字节跳动Intelligent Creation团队开发的开源高保真个性化视频生成模型,基于Diffusion Transformer(DiT)架构,通过ID-adapter(身份保留)和Ref-adapter(空间细节...
OpenPPT是必优科技基于ChatPPT核心服务开源的Web端在线AI PPT生成创作工具,覆盖PPT从“新建/导入”“编辑”“美化排版”“播放”“演讲”到“导出下载”的全流程服务。其支...
xLLM 是京东开源的一款高性能大语言模型推理框架,专为国产 AI 加速器优化,采用服务 - 引擎解耦架构,实现高效的企业级部署。该框架通过全图流水线执行、动态形状图优化、...
Dolphin是字节跳动推出的一款多模态文档图像解析框架,采用"分析-解析"两阶段范式,通过异构锚点提示技术实现高精度文档理解。该框架能够有效识别和解析文档中的文本段落、...
Qwen3-ASR-Toolkit是一个专为Qwen-ASR API设计的高性能Python命令行工具包。它通过智能音频分割和并行处理,突破了API的3分钟时长限制,支持超长音频和视频的高效转录。该工...
Hunyuan3D-Part是腾讯混元团队开源的3D形状部件分割与生成框架,包含P3-SAM和X-Part两个核心组件,实现从3D模型到语义部件分割和高保真结构分解的完整流程。该项目适用于3D...
在计算机视觉领域,图像分割技术是推动智能系统理解复杂场景的核心工具。语义分割、实例分割与全景分割作为三种主流方法,分别从不同维度解决了像素级场景理解的挑战。本文...
