TensorRT-LLM:英伟达开源的LLM推理优化框架,极致提速GPU大模型部署与运行
TensorRT-LLM是NVIDIA推出的开源大语言模型(LLM)推理优化框架,专为NVIDIA全系列GPU量身打造。该框架整合了投机解码、专家并行、KV-Cache智能管理、低精度量化等前沿技术...
TensorRT-LLM是NVIDIA推出的开源大语言模型(LLM)推理优化框架,专为NVIDIA全系列GPU量身打造。该框架整合了投机解码、专家并行、KV-Cache智能管理、低精度量化等前沿技术...
FrankenMotion是一款开源的部位级人体运动生成与合成框架,项目构建了全球首个具备异步、部位级文本标注的Frankenstein运动数据集,并提出基于扩散模型的部位感知运动生成方...
Agentation是一款专为React 18+项目设计的agent-agnostic视觉反馈工具,通过可视化标注页面元素生成精准CSS选择器与结构化Markdown,解决AI编程助手定位代码模糊问题,提升...
PersonaPlex是NVIDIA研究团队于2026年1月开源的全双工实时语音对语音对话模型,基于Kyutai的Moshi架构与Helium语言模型构建,核心解决传统语音助手“听一次、答一次”的僵化...
Claude-Ally-Health(WellAlly)是一款开源文件型个人健康信息管理系统,依托Claude Code CLI工具实现全流程健康数据管理。其整合了医疗报告智能识别、13个专科的多学科会诊...
详解 Qwen-Image-Edit 本地部署全流程:从环境配置、依赖安装到模型加载与Web界面启动,附多GPU显存优化技巧与常见问题解决方案,助你快速搭建高性能AI图像编辑系统。
Playwriter是一套围绕浏览器自动化与AI协同构建的工具集,核心由Chrome扩展(Playwriter MCP)和本地Node.js中继服务组成,主打通过Chrome DevTools Protocol (CDP) 让Play...
Baichuan-M3-235B是百川智能开源的2350亿参数级医疗增强大语言模型,主打原生低幻觉能力与端到端严肃问诊特性,该模型基于临床诊疗流程设计,能模拟医生思维主动追问关键信...
BabyVision是一款面向多模态大模型(MLLM)和图像生成模型的纯视觉推理能力开源评估基准,由UniPat-AI团队联合红杉中国xbench共同开发,隶属于xbench双轨评估体系中AGI Tra...
RAG-Anything 是由香港大学数据智能实验室(HKUDS)开源的一站式多模态检索增强生成(RAG)框架,基于 LightRAG 构建,突破传统文本类 RAG 系统的技术限制,可无缝处理 PDF...
