VitaBench:美团联合 Sierra Research 推出的 LLM 智能体生活服务场景基准测试框架
VitaBench 是一款由美团与 Sierra Research 联合开发的开源基准测试框架,专为评估大型语言模型(LLM)智能体在真实生活服务场景中的综合能力而设计。该框架通过模拟外卖、...
VitaBench 是一款由美团与 Sierra Research 联合开发的开源基准测试框架,专为评估大型语言模型(LLM)智能体在真实生活服务场景中的综合能力而设计。该框架通过模拟外卖、...
Genkit是Google Firebase团队开发并开源的全栈AI应用开发框架,核心目标是简化AI应用从开发、测试到生产部署的全流程。该框架提供统一接口,可无缝集成Google Gemini、Open...
OpenSpec 是 Fission-AI 开源的 AI 编程辅助工具,核心靠 “结构化规范文档” 解决 AI 编程中 “需求藏在聊天记录里导致模糊、返工” 的痛点。它无需 API 密钥,通过轻量级...
MemU 是由 NevaMind-AI 开发的开源 AI 伴侣记忆框架,旨在为 AI 伴侣提供高精度、低成本、可扩展的记忆能力。通过文件系统式记忆组织、互联知识图谱、自适应遗忘机制等核心...
Kronos是首个针对金融市场K线序列的开源基础模型,训练数据覆盖全球45+交易所。该模型采用“K线令牌化+自回归Transformer”两阶段框架,将连续的OHLCV(开盘价、最高价、最...
Meta旗下即时通讯平台WhatsApp近日大幅修订商业API政策,明确禁止通用型AI聊天机器人在其平台上运行,涉及OpenAI、Perplexity、Khosla Ventures投资的Luzia及General Catal...
LongCat-Audio-Codec 是美团 LongCat 团队开源的音频编码(Tokenizer)与解码(Detokenizer)解决方案,专为语音大语言模型(Speech LLM)设计。该方案通过并行生成语义令牌...
Coral NPU是由Google Research设计的开源神经网络处理单元(NPU),基于RISC-V 32位指令集架构,定位为超低功耗片上系统(SoC)的ML推理硬件加速器,核心适配助听器、AR眼镜...
nanoGPT是由AI研究者Andrej Karpathy开发的开源项目,基于PyTorch框架构建,定位为“最简单、最高效的中等规模GPT训练与微调仓库”。它是minGPT的重写版本,核心目标是“优...
MiniMind 是一个旨在拉低大语言模型(LLM)学习与实践门槛的开源项目,核心目标是让普通用户通过 “3 元 GPU 服务器成本 + 2 小时单卡训练”,从 0 构建并部署仅 25.8M 参数...