FastMTP:腾讯开源的大语言模型推理加速技术
FastMTP是由腾讯BAC团队开发的一种针对大语言模型(LLM)的高效推理加速技术,旨在通过增强多token预测(Multi-Token Prediction, MTP)能力来显著提升大语言模型的推理速度...
FastMTP是由腾讯BAC团队开发的一种针对大语言模型(LLM)的高效推理加速技术,旨在通过增强多token预测(Multi-Token Prediction, MTP)能力来显著提升大语言模型的推理速度...
Ling-V2是一款基于混合专家(Mixture of Experts,MoE)架构设计的开源大型语言模型系列,旨在实现高性能与计算效率的完美平衡。作为开源大语言模型领域的创新成果,Ling-V...
Translation Agent是由吴恩达其合作者开发的一款开源Python工具,核心依托大语言模型(LLM)构建智能体(agentic)反射工作流,实现机器翻译功能。不同于传统机器翻译系统直...
Nanobrowser是一款开源的AI网页自动化工具,以浏览器扩展程序的形式运行,作为OpenAI Operator的免费替代方案,它打破了传统网页自动化工具的局限,通过创新的多代理系统和...
SQLBot是一款基于大模型和RAG技术开发的开源智能问数系统,旨在通过自然语言交互的方式实现高质量的文本转SQL(text2sql)功能。它能够让用户无需掌握复杂的SQL语法,只需用...
FireRedTTS-2是一款开源的文本转语音(TTS)系统,专注于多角色对话场景下的长格式语音生成。该系统采用先进的深度学习架构,能够生成自然流畅的语音,同时支持多个说话人之...
DeepResearch是由阿里巴巴通义实验室(Tongyi Lab)开发的开源项目,专注于构建长周期、深度信息检索任务的智能代理模型。该项目旨在通过先进的人工智能技术,实现自动化的...
RustGPT是一个完全基于Rust编程语言实现的大型语言模型(LLM)开源项目,该项目的核心目标是展示如何在不依赖任何外部机器学习框架的情况下,仅使用Rust生态中的ndarray库进...
Wren AI是一个开源的生成式商业智能(GenBI)代理工具,旨在通过自然语言交互简化数据查询与分析流程。它能够让用户以日常语言提问的方式查询任何数据库,自动生成精确的SQ...
SenseVoice是由阿里通义实验室开源的一款具备强大音频理解能力的音频基础模型,致力于为各类语音及声学相关场景提供高效、精准的技术支撑。该模型基于深度学习技术构建,采...
PaddleOCR是由百度飞桨(PaddlePaddle)团队开发的开源光学字符识别(OCR)引擎,旨在为开发者提供工业级的文本识别与文档解析解决方案。作为百度飞桨生态的重要组成部分,...
LLaSO是一个面向大规模语音-语言建模研究的开源框架,该框架以端到端的方式整合了数据资源、评估基准和建模工具,旨在为语音-语言交叉领域的研究提供标准化、可复现的基础平...
DeepCode是由香港大学数据智能实验室(HKU Data Science Lab)开发的开源多智能体AI编程助手,它基于先进的多智能体系统架构,旨在通过人工智能技术实现代码生成的自动化与...
OpenCode是一款专为终端环境设计的AI编码代理工具,旨在通过人工智能技术辅助开发者完成各类软件开发任务。它能够与多种大语言模型(LLM)集成,为开发者提供代码生成、bug...
IndexTTS2是B站开源的新一代自回归文本到语音(TTS)模型,是IndexTTS系列的最新迭代版本,专注于解决情感表达精准控制与语音时长灵活调节的核心痛点。作为工业级TTS解决方...