开源项目

FrankenMotion：开源部位级人体运动生成与合成框架，精准控制细粒度异步运动

FrankenMotion是一款开源的部位级人体运动生成与合成框架，项目构建了全球首个具备异步、部位级文本标注的Frankenstein运动数据集，并提出基于扩散模型的部位感知运动生成方...

4个月前 AI新闻

121

OpenJudge：开源AI应用评估与优化框架

OpenJudge是一款专为AI应用设计的开源评估框架，基于Python开发，核心定位是为AI智能体、聊天机器人、多模态应用、代码生成系统等各类AI应用提供标准化、自动化、全维度的质...

4个月前 AI新闻

177

Agentation：React前端视觉标注工具，精准传递页面元素给AI编程助手

Agentation是一款专为React 18+项目设计的agent-agnostic视觉反馈工具，通过可视化标注页面元素生成精准CSS选择器与结构化Markdown，解决AI编程助手定位代码模糊问题，提升...

4个月前 AI新闻

168

VerseCrafter：复旦、港大&腾讯联合开源的 4D 几何可控的动态真实视频世界模型

VerseCrafter是由复旦大学、香港大学与腾讯ARC Lab联合研发的开源动态真实视频世界模型，核心突破传统视频生成的几何不可控瓶颈，实现对相机运动、多目标3D轨迹及二者协同关...

4个月前 AI新闻

146

LightOnOCR-2-1B：LightOnAI开源的10 亿参数开源端到端 OCR 模型

LightOnOCR-2-1B 是由 LightOnAI 开源的端到端多语言视觉 - 语言 OCR 模型，仅含 10 亿参数，却实现了当前业界领先的识别性能。该模型打破传统多阶段 OCR 流水线的局限，可...

4个月前 AI新闻

251

MTranServer：开源离线翻译服务器，低耗高速私有化部署解决方案

MTranServer 是一款开源的离线翻译服务器解决方案，基于优化的神经网络翻译模型构建，无需显卡支持即可在普通 CPU 设备上流畅运行。其核心优势在于超低资源消耗、50毫秒级极...

4个月前 AI新闻

173

Claude-Ally-Health：开源本地化 AI 健康管理系统，全流程医疗数据智能管控与多专科分析

Claude-Ally-Health（WellAlly）是一款开源文件型个人健康信息管理系统，依托Claude Code CLI工具实现全流程健康数据管理。其整合了医疗报告智能识别、13个专科的多学科会诊...

4个月前 AI新闻

168

Superpowers：开源AI编码代理工作流框架，强制工程规范的技能化开发体系

Superpowers是一款专为AI编码代理打造的完整软件开发工作流增强框架，其核心是将人类软件工程中的经典最佳实践转化为AI可理解、可执行的强制性标准化协议，通过模块化的“技...

4个月前 AI新闻

480

Baichuan-M3-235B：百川智能推出的 2350 亿参数级专业医疗大模型

Baichuan-M3-235B是百川智能开源的2350亿参数级医疗增强大语言模型，主打原生低幻觉能力与端到端严肃问诊特性，该模型基于临床诊疗流程设计，能模拟医生思维主动追问关键信...

4个月前 AI新闻

232

qqr：阿里巴巴开源的开放式智能体强化学习训练工具

qqr（也称作hilichurl）是由阿里巴巴自然语言处理（NLP）团队开源的一款轻量级、非侵入式的开放式智能体训练扩展工具，核心开发语言为Python。该工具以slime为基础进行构建...

4个月前 AI新闻

131

BabyVision：UniPat-AI开源的多模态大模型视觉推理评估基准

BabyVision是一款面向多模态大模型（MLLM）和图像生成模型的纯视觉推理能力开源评估基准，由UniPat-AI团队联合红杉中国xbench共同开发，隶属于xbench双轨评估体系中AGI Tra...

4个月前 AI新闻

140

Engram：DeepSeek开源的大模型静态记忆增强工具，实现记忆与计算的最优分配

Engram是由DeepSeek AI开源的大语言模型条件记忆模块，作为混合专家（MoE）之外的互补稀疏性方案，它将经典N-gram嵌入现代化，实现了O(1)时间复杂度的知识查找。该模块通过...

4个月前 AI新闻

220

ChatDev：OpenBMB开源的零代码多智能体编排平台

ChatDev 是由 OpenBMB 团队研发的一款重量级开源零代码多智能体编排平台，该项目摆脱传统编码开发门槛，通过可视化配置与 YAML 文件定义智能体角色、协作流程与任务逻辑，实...

5个月前 AI新闻

203

UI-TARS-desktop：字节跳动开源的多模态AI智能体，一站式GUI智能任务自动化桌面工具

UI-TARS-desktop是字节跳动开源的多模态AI智能体桌面应用项目，基于UI-TARS模型构建，集成Agent TARS通用多模态AI智能体栈，提供本地/远程计算机、浏览器GUI智能操作能力，...

5个月前 AI新闻

253

Open Interpreter：开源本地运行的大语言模型代码执行工具

Open Interpreter是一款开源的大语言模型代码执行工具，核心解决OpenAI官方Code Interpreter托管式、闭源、限制多的痛点，支持在本地环境运行Python、Javascript、Shell等多...

5个月前 AI新闻

207

开源项目新闻、工具、教程及资源推荐

FrankenMotion：开源部位级人体运动生成与合成框架，精准控制细粒度异步运动

OpenJudge：开源AI应用评估与优化框架

Agentation：React前端视觉标注工具，精准传递页面元素给AI编程助手

VerseCrafter：复旦、港大&腾讯联合开源的 4D 几何可控的动态真实视频世界模型

LightOnOCR-2-1B：LightOnAI开源的10 亿参数开源端到端 OCR 模型

MTranServer：开源离线翻译服务器，低耗高速私有化部署解决方案

Claude-Ally-Health：开源本地化 AI 健康管理系统，全流程医疗数据智能管控与多专科分析

Superpowers：开源AI编码代理工作流框架，强制工程规范的技能化开发体系

Baichuan-M3-235B：百川智能推出的 2350 亿参数级专业医疗大模型

qqr：阿里巴巴开源的开放式智能体强化学习训练工具

BabyVision：UniPat-AI开源的多模态大模型视觉推理评估基准

Engram：DeepSeek开源的大模型静态记忆增强工具，实现记忆与计算的最优分配

ChatDev：OpenBMB开源的零代码多智能体编排平台

UI-TARS-desktop：字节跳动开源的多模态AI智能体，一站式GUI智能任务自动化桌面工具

Open Interpreter：开源本地运行的大语言模型代码执行工具