LLaMA-Factory:一站式大模型高效微调框架,零代码适配百种模型与全流程训练
LLaMA-Factory是一站式统一高效大语言模型与多模态模型微调框架,项目核心目标是降低大模型定制化训练的技术门槛,让零基础用户、开发者、科研人员与企业工程师,都能在无需...
LLaMA-Factory是一站式统一高效大语言模型与多模态模型微调框架,项目核心目标是降低大模型定制化训练的技术门槛,让零基础用户、开发者、科研人员与企业工程师,都能在无需...
MOVA是由OpenMOSS团队研发的开源音视频同步生成基础模型,其采用非对称双塔架构与双向交叉注意力机制,在多语言唇形同步、环境音效匹配上达到领先水平,全栈开放模型权重、...
TensorRT-LLM是NVIDIA推出的开源大语言模型(LLM)推理优化框架,专为NVIDIA全系列GPU量身打造。该框架整合了投机解码、专家并行、KV-Cache智能管理、低精度量化等前沿技术...
FrankenMotion是一款开源的部位级人体运动生成与合成框架,项目构建了全球首个具备异步、部位级文本标注的Frankenstein运动数据集,并提出基于扩散模型的部位感知运动生成方...
Agentation是一款专为React 18+项目设计的agent-agnostic视觉反馈工具,通过可视化标注页面元素生成精准CSS选择器与结构化Markdown,解决AI编程助手定位代码模糊问题,提升...
PersonaPlex是NVIDIA研究团队于2026年1月开源的全双工实时语音对语音对话模型,基于Kyutai的Moshi架构与Helium语言模型构建,核心解决传统语音助手“听一次、答一次”的僵化...
Claude-Ally-Health(WellAlly)是一款开源文件型个人健康信息管理系统,依托Claude Code CLI工具实现全流程健康数据管理。其整合了医疗报告智能识别、13个专科的多学科会诊...
详解 Qwen-Image-Edit 本地部署全流程:从环境配置、依赖安装到模型加载与Web界面启动,附多GPU显存优化技巧与常见问题解决方案,助你快速搭建高性能AI图像编辑系统。
Playwriter是一套围绕浏览器自动化与AI协同构建的工具集,核心由Chrome扩展(Playwriter MCP)和本地Node.js中继服务组成,主打通过Chrome DevTools Protocol (CDP) 让Play...
Baichuan-M3-235B是百川智能开源的2350亿参数级医疗增强大语言模型,主打原生低幻觉能力与端到端严肃问诊特性,该模型基于临床诊疗流程设计,能模拟医生思维主动追问关键信...
