OpenBench:开源大模型评估工具,支持多平台基准测试
OpenBench 是由 Groq 团队开发的开源大模型评估工具,旨在为研究人员和开发者提供一个与模型提供商无关的基准测试平台。它支持 35+ 评估套件和 30+ 模型提供商,涵盖知识、...
OpenBench 是由 Groq 团队开发的开源大模型评估工具,旨在为研究人员和开发者提供一个与模型提供商无关的基准测试平台。它支持 35+ 评估套件和 30+ 模型提供商,涵盖知识、...
本文AI铺子详细介绍如何在 Stable Diffusion 中使用 LoRA 技术训练个性化画风,涵盖数据准备、参数设置、模型训练到 WebUI 加载的完整流程。通过图文教程手把手教你打造专属...
Sim是由SimStudio团队开发的开源AI代理工作流工具,旨在帮助用户在几分钟内快速构建、部署和运行AI驱动的自动化工作流。无论是开发者、团队管理者还是企业用户,都能通过Si...
Open-o3 Video是一款专注于可验证视频理解的开源项目,通过整合关键时间戳、目标边界框等时空证据,解决了传统视频推理“结论无依据、过程不可验证”的痛点。项目构建了专用...
Ouro 是多机构联合研发的开源循环语言模型系列,核心创新在于将“推理能力”融入预训练阶段,而非依赖传统大语言模型(LLM)的 post-training 显式文本生成。该系列包含 Ou...
模型剪枝(Model Pruning)作为一种经典的模型压缩技术,通过移除神经网络中冗余的权重或结构,在保持模型性能的同时显著降低计算和存储开销。本文AI铺子将从剪枝的基本原理...
AgenticSeek是一款100%本地运行的开源AI智能体平台,定位为Manus AI的替代方案,专注于隐私保护与本地自主能力。它支持智能网页浏览、多语言编程辅助、复杂任务规划等功能,...
TensorZero 是一款面向工业级 LLM(大语言模型)应用的开源技术栈,旨在解决多模型接入复杂、高并发场景性能不足、应用效果难评估等核心问题。它提供统一的 LLM 网关、全链...
大模型蒸馏——这项诞生于2015年的技术,在2025年已成为AI工程化的核心支柱。它通过知识迁移的魔法,让7B参数的学生模型达到70B教师模型97%的性能,让BERT的推理速度提升10...
HippoRAG 2 是由俄亥俄州立大学自然语言处理组开发的开源大型语言模型(LLMs)记忆增强框架,核心目标是解决传统 RAG系统在知识关联、复杂上下文整合方面的不足。该框架通过...
