ZipVoice:轻量高效的零样本语音合成模型
ZipVoice是一款基于流匹配技术的零样本语音合成TTS模型,核心定位是在保证高质量语音输出的同时,实现轻量化模型架构与快速推理性能的平衡。支持通过少量参考语音(提示音频...
ZipVoice是一款基于流匹配技术的零样本语音合成TTS模型,核心定位是在保证高质量语音输出的同时,实现轻量化模型架构与快速推理性能的平衡。支持通过少量参考语音(提示音频...
Youtu-GraphRAG是由腾讯云ADP团队开发的一款开源图增强推理框架,它以图Schema为核心,构建了垂直统一的技术体系,将整个GraphRAG框架作为基于图模式的复杂集成体进行联合连...
Perplexica是一个开源的AI搜索引擎,其设计灵感来源于Perplexity AI,旨在通过结合本地大语言模型(LLM)的理解能力与网络搜索的实时信息获取能力,为用户提供更智能、更精...
Crawl4AI是一个开源的网络爬虫和内容提取工具,专为与大型语言模型(LLM)协同工作而设计。它能够从网页中智能提取有价值的信息,并将其转换为干净、结构化的Markdown格式,...
DeepResearchAgent是由SkyworkAI团队开发的一款开源分层多智能体系统框架。该框架旨在通过顶层规划智能体与多个专门化低层智能体的协同工作,实现对复杂研究任务的自动化处...
KChat是一款基于人工智能技术的开源AI聊天应用程序,其核心定位是为用户提供“无缝且智能的对话体验”。该应用以视觉表现力突出的“液态玻璃”(Glassmorphism)界面为设计...
New API是一个基于One API进行二次开发的开源大模型网关与AI资产管理系统。它旨在为用户提供更丰富的功能和更优的用户体验,帮助个人开发者、企业团队以及AI服务提供商更高...
AutoPrompt是一个开源的AI提示词优化框架,旨在通过自动化辅助工具和系统化流程,帮助用户生成高质量、高可靠性的提示词,从而提升大语言模型(LLM)在各类实际应用场景中的...
ZCF(Zero-Config Claude-Code Flow)是一款针对Claude Code的零配置、一键式设置工具,旨在降低Claude Code的使用门槛,帮助开发者快速搭建AI驱动的开发工作流。它整合了工...
ROMA是一个开源的分层任务执行框架,旨在简化复杂多智能体系统的构建过程。该框架基于MECE原则设计,将所有任务拆解为"思考(THINK)、写作(WRITE)、搜索(SEARCH)"三种...
Robust Video Matting(RVM) 是由字节跳动(ByteDance)开发的开源视频抠图工具,专注于从视频中高精度分离前景人物与背景。与传统逐帧处理的抠图方法不同,RVM通过循环神...
Story Flicks是一款基于 多模态AI大模型 的开源视频生成工具,用户只需输入一个故事主题,系统就能自动生成包含 高清图像、动态分镜、多语言配音、智能字幕 的完整短视频。...
Mini-o3(或称为o3-mini)是OpenAI于2025年2月推出的低成本高性能推理模型,属于其“推理系列”模型中的最新成员,定位为旗舰模型o3的经济版。它的核心目标是在STEM领域(科...
LaVie 是一个基于 PyTorch 实现的AI文生视频框架,它是视频生成系统 Vchitect 的核心组成部分。LaVie 旨在通过深度学习模型,将用户输入的自然语言文本转化为高质量的视频内...
AutoAgent是由香港大学数据智能实验室(HKUDS)开发的一款零代码、全自动化的大型语言模型(LLM)智能体框架,其核心理念是"让AI开发无门槛"。该项目旨在通过纯自然语言交互,让...