AI新闻资讯 - 最新人工智能技术动态与热点资讯

MiniCPM-o 4.5：面壁智能开源的端侧离线全模态实时交互 AI 模型

MiniCPM-o 4.5是由面壁智能（OpenBMB）研发并开源的9B参数全双工全模态大语言模型，属于MiniCPM-V多模态模型系列的新一代旗舰版本，其实现了视频、音频、文本的实时流感知与...

1个月前 97ai

124

Kilo CLI 1.0：基于 OpenCode 的开源智能体工程命令行工具

Kilo 团队正式发布 Kilo CLI 1.0，这是一款基于 MIT 协议开源、模型无关的终端原生智能体工程命令行工具，支持 500 + 模型自由选择，可与 Kilo 智能体工程平台无缝协同，打...

1个月前 AI工具箱

186

Intern-S1：上海AI实验室开源的多模态科学领域开源大模型

Intern-S1是上海AI实验室研发并开源的通专融合多模态科学推理大模型，是面向全球科研工作者、开发者与教育机构打造的通用科学AI基础平台，核心定位是解决科学研究中多模态数...

1个月前 dotaai

74

ACE-Step 1.5：ACE Studio与StepFun联合开源的AI音乐生成模型，4GB显存即可生成专业级音频

ACE-Step 1.5是一款由ACE Studio与StepFun联合开发的开源音乐生成基础模型，主打在消费级硬件上实现商用级别的音乐生成能力，仅需4GB显存即可本地运行，兼具极速生成、多语...

1个月前 AI工具集

115

LingBot-VA：蚂蚁灵波开源的机器人自回归视频 - 动作世界模型

LingBot-VA是蚂蚁灵波开源的一款面向通用机器人控制的因果视频-动作世界建模框架，核心基于自回归视频预测与逆向动力学推理，打破传统机器人“观察-反应”的固有模式，通过...

1个月前 AI工具箱

87

InteractAvatar：面向场景物体交互的开源 AI 说话数字人生成框架

InteractAvatar是一款开源的文本驱动、场景感知、人物-物体交互可控的说话数字人（Talking Avatar）生成框架，核心解决当前数字人生成领域长期存在的控制-质量两难问题——...

1个月前人工智能研究所

132

TeleStyle：中国电信开源的零样本高保真图像视频风格迁移框架

TeleStyle是由中国电信人工智能研究院（Tele-AI）开源的内容保留式图像与视频双模态风格迁移模型，基于Qwen-Image-Edit基座与DiT架构构建，在不微调、不针对特定风格训练的...

1个月前 AI铺子

106

玄武 CLI：清昴智能开源的国产芯片友好型大模型命令行管理工具

玄武CLI是由清昴智能开源的国产算力原生大模型命令行管理工具，被业内称为“国产版 Ollama”。它提供一套轻量化、无依赖、开箱即用的大模型部署与运行平台，让使用者在不掌...

1个月前 97ai

111

GLM-OCR：智谱 AI 开源的轻量化高精度文档 OCR 模型

GLM-OCR是智谱AI开源的轻量级多模态文档OCR模型，核心定位是小参数、高精度、易部署、全场景覆盖的专业级文档理解与文字提取工具。它基于GLM-V视觉-语言编码器-解码器架构构...