dInfer:蚂蚁集团推出的扩散语言模型专用高性能推理框架
dInfer 是蚂蚁集团开源的针对扩散语言模型(dLLMs)的高效可扩展推理框架,该框架通过模块化设计将推理流程拆解为模型、扩散迭代管理器、解码策略、KV 缓存管理四大组件,支...
dInfer 是蚂蚁集团开源的针对扩散语言模型(dLLMs)的高效可扩展推理框架,该框架通过模块化设计将推理流程拆解为模型、扩散迭代管理器、解码策略、KV 缓存管理四大组件,支...
近日,谷歌正式推出Nano Banana图像编辑功能,并在其Gemini应用中收获了良好反响。这一功能现已集成至AI模式和Google Lens,为用户提供更便捷的图像编辑与生成服务。根据...
据The Information报道,全球估值最高的AI编码助手公司Anysphere正与Coatue、Accel等顶级投资机构洽谈新一轮融资,融资规模至少10亿美元,融资前估值已飙升至270亿美元。这...
在人工智能浪潮席卷全球的当下,AI芯片市场的竞争已进入白热化阶段,英伟达长期占据着主导地位。然而,科技巨头甲骨文(Oracle)近期宣布的一系列重大举措,犹如一颗重磅炸...
Real-Time-Voice-Cloning 是一个基于深度学习的开源语音克隆框架,能够通过几秒钟的音频样本克隆说话人的声音,并基于任意文本生成该说话人的语音。该项目实现了 SV2TTS架构...
SurfSense 是一个开源的 AI 研究代理工具,旨在为用户提供高效的知识管理和信息检索解决方案。它允许您整合个人知识库与多种外部数据源,构建一个高度个性化的研究环境。通...
BitNet是微软推出的一个开源1-bit大语言模型推理框架,专门用于运行1-bit量化的大语言模型(LLM)。该项目最初是为了支持微软自研的BitNet b1.58模型而创建的,但现在已经扩...
NeuTTS Air 是一个开源文本转语音项目,专注于设备端部署和即时语音克隆功能。它采用先进的 LM+codec 架构,在保持轻量级和高效率的同时,提供高质量、超写实的语音合成。仅...
近日,蚂蚁集团正式开源了业内首个高性能扩散语言模型推理框架 ——dInfer。这一框架的推出,不仅意味着扩散语言模型在推理速度上取得了重大突破,也标志着这一新兴技术向实...
2025 年 10 月 13 日,微软 AI(Microsoft AI)正式对外发布旗下首款完全自研的图像生成模型 ——MAI-Image-1。该模型首次亮相便凭借出色性能跻身 LMArena 平台文本到图像模型...