MiniCPM:面壁智能联合清华大学等开源的轻量级大语言模型,兼顾端云部署与高效推理
MiniCPM 是由面壁智能、清华大学自然语言处理实验室、中国人民大学高瓴人工智能学院联合开发的一系列轻量级大语言模型开源项目。项目涵盖多版本模型迭代,兼顾性能与效率,...
MiniCPM 是由面壁智能、清华大学自然语言处理实验室、中国人民大学高瓴人工智能学院联合开发的一系列轻量级大语言模型开源项目。项目涵盖多版本模型迭代,兼顾性能与效率,...
Oh My OpenCode是一款面向开发者的开源AI编程效率增强工具,本质是基于OpenCode的智能体增强框架与插件包,被开发者形象地称为“编程效率的类固醇”。该项目采用TypeScript...
Spirit-v1.5是由千寻智能(Spirit AI)研发并开源的端到端视觉-语言-动作(VLA)具身智能基础模型,该模型在RoboChallenge Table30基准测试中以66.09分的综合得分和50.33%的...
EvoCUA(Evolving Computer Use Agent)是由美团公司重磅开源的一款通用多模态计算机使用智能体,核心能力为基于实时桌面截图与自然语言指令,实现对主流桌面软件的端到端、...
UI-TARS-desktop是字节跳动开源的多模态AI智能体桌面应用项目,基于UI-TARS模型构建,集成Agent TARS通用多模态AI智能体栈,提供本地/远程计算机、浏览器GUI智能操作能力,...
MiroThinker是MiroMind研究院推出的开源搜索智能体(Search Agent)项目,聚焦增强工具辅助推理与信息检索能力,通过“交互式缩放”技术突破传统大模型性能瓶颈,提供多参数...
AI Agent(智能体) 作为基于LLM的下一代智能交互形态,正逐渐成为行业关注的焦点。它不再是简单的“输入输出”工具,而是能够自主感知环境、规划任务、执行操作并持续学习...
AutoMV是一款基于多智能体架构的开源音乐视频(MV)自动生成系统,无需额外训练即可直接从全长歌曲输出连贯、高质量的长格式MV。该系统整合音乐信号分析、智能脚本编写、角...
ClipSketch AI是一款专为短视频创作者、二创爱好者和社交媒体运营者设计的开源工具,基于Google Gemini多模态模型构建,支持解析B站、小红书等平台的视频链接,通过帧级标记...
ProEdit是中山大学ISEE实验室联合多所高校研发的开源基于反转的提示词驱动型AI图像与视频编辑工具,核心聚焦传统反转类编辑工具"源信息干扰导致编辑不精准、背景易误伤"的行...
