PlanningBench:腾讯混元开源大模型规划能力评测与训练框架
PlanningBench 是腾讯混元联合中国人民大学开源的大模型规划能力一体化框架,支持多场景规划任务生成、大模型能力自动化评测、结果智能校验与训练数据集制作,内置海量标准...
PlanningBench 是腾讯混元联合中国人民大学开源的大模型规划能力一体化框架,支持多场景规划任务生成、大模型能力自动化评测、结果智能校验与训练数据集制作,内置海量标准...
介绍让 AI 看懂代码库的方法,详细讲解 GitNexus 知识库搭建全流程,解决传统 AI 编程工具对代码架构理解不足问题,提升开发效率与代码质量。
Microsoft Scout是微软首款Autopilot自治型企业AI智能体,于2026年6月2日微软Build全球开发者大会正式对外发布,基于开源Agent框架OpenClaw(龙虾框架)深度定制开发,归属...
Odysseus是基于MIT协议开源的本地私有化AI工作台,支持Ollama、llama.cpp、vLLM多推理引擎接入,内置智能Agent与ChromaDB私有向量知识库,硬件自动匹配适配大模型,全数据本...
Music v2是英国伦敦AI音频独角兽企业ElevenLabs 发布的第二代文生全链路AI音乐生成大模型,是品牌从TTS语音赛道跨界深耕AI作曲的迭代旗舰产品,主打分段模块化编曲、单曲内...
Webwright是微软开源的终端原生Web智能体框架,核心采用代码驱动范式,让大模型自动生成Playwright脚本操控浏览器,摒弃传统点击预测模式。框架极简轻量(约1000行代码),...
Claude Opus 4.8 是由美国人工智能公司 Anthropic 发布的 Claude 4系列旗舰大语言模型,是Opus 4.7的迭代优化版本,定位为面向企业级复杂任务与专业场景的全能型AI模型。该...
SenseNova-U1-8B-MoT-Infographic 是商汤科技(SenseTime)旗下日日新(SenseNova)团队推出的开源多模态信息图专项优化模型,基于SenseNova-U1-8B-MoT基础模型迭代而来,聚...
opera-browser-cli 是Opera官方开源的浏览器命令行自动化工具,基于Node.js开发,针对AI智能体优化,具备TOON编码省令牌、持久会话、网页调试、批量自动化等能力,跨平台支...
ForgeTrain 是 OpenBMB 开源的全球首款 100% AI 自主编写生产级大模型预训练框架,零人工代码修改,在 H100 显卡上 MFU 达 44.13%,较 Megatron‑LM 提升约 10%,支持 Mini...
