Faster-Whisper:基于CTranslate2的高性能语音转文本引擎,4倍速推理与低内存占用双突破
Faster-Whisper是由SYSTRAN团队开发并开源的OpenAI Whisper语音转文本模型的高性能重构实现,核心依托CTranslate2——一款专为Transformer架构设计的轻量级、高性能推理引擎...
Faster-Whisper是由SYSTRAN团队开发并开源的OpenAI Whisper语音转文本模型的高性能重构实现,核心依托CTranslate2——一款专为Transformer架构设计的轻量级、高性能推理引擎...
IOPaint是由Sanster开发的一款完全免费、开源可本地自托管的AI图像编辑工具,依托LaMa、Stable Diffusion Inpainting、PowerPaintV2、AnyText等前沿AI模型,提供图像擦除、...
魔因漫创(Moyin Creator)是MemeCalculate团队开源的AI影视生产级工具,基于TypeScript与Electron构建,深度支持Seedance 2.0多模态能力,提供从剧本解析、角色管理、场景...
近日,中国微短剧行业正经历一场前所未有的“无声地震”。当观众还在为《斩仙台AI真人版》上线6天播放破亿、《苞米地后的新生》单剧播放量突破5000万而惊叹时,行业内部的寒...
LoRWeB是NVIDIA研究院发布的开源视觉类比学习框架,核心通过可学习的LoRA权重基底与轻量级编码器动态加权组合,实现“示例驱动”的通用图像编辑。给定图像三元组{a,a'...
AngelSlim是腾讯混元AI Infra团队开源的一站式大模型压缩与推理加速工具包,支持LLM、多模态、音频、扩散模型全栈压缩,提供从FP8/INT4到1.25bit的极致量化、Eagle3推测解码...
CrewAI是一款轻量、高性能、生产就绪的Python开源框架,专注于多AI智能体自主协作与任务编排。它把现实世界的团队分工模式搬进代码:你定义不同角色的智能体,分配明确任务...
深度解析LLaMA-2(7B/13B/70B)与Mixtral(MoE架构)的提示词适配逻辑:5大LLaMA-2调优技巧(含Few-Shot、温度协同、否定约束)+3大Mixtral专属技巧(专家引导、分段标注、...
MoChat是由香港大学HKUDS团队开源的AI智能体原生即时通讯平台,以“Agent-Native(智能体原生)”为核心设计理念,将AI智能体作为平台一等公民,彻底解决了Slack、Discord等...
BitDance是由字节跳动等机构联合推出的开源自回归生成模型项目,核心解决传统离散自回归模型在视觉生成中令牌器重建质量低、词汇表过大采样困难、逐令牌生成速度慢等痛点,...
