AI新闻资讯 - 最新人工智能技术动态与热点资讯

LLM Council：开源多模型议会协同问答工具，匿名互评整合优质答案

LLM Council 是Andrej Karpathy 开源的多模型议会式协作问答系统，项目摒弃传统单一大模型问答模式，模拟议会议事逻辑，将多款主流大语言模型组建为议事委员团队，通过独立...

2个月前 97ai

142

SenseNova-Skills：商汤开源AI办公技能库，模块化插件赋能智能体全场景办公

SenseNova-Skills是基于SenseNova大模型打造的开源办公技能仓库，具备图像创作、PPT生成、数据分析、深度研究、聚合搜索功能，支持多智能体框架适配，本地云端双部署，适用...

2个月前 dotaai

178

Confucius4：网易有道开源的数理推理大模型，图文习题智能解答高效作答

Confucius4也被称作子曰4，是网易有道人工智能研发团队依托通义千问Qwen3.5-27B基座模型深度二次开发打造的开源多模态大语言模型，整体参数规模达到27B，该模型核心研发方向...

2个月前 AI工具集

142

AutoResearch：开源AI自主科研框架，自动迭代大模型训练代码

AutoResearch是Andrej Karpathy推出的开源AI自主科研框架，依托AI智能体实现无人值守修改训练代码、限时模型训练与性能筛选，单机GPU即可部署运行。本文详细介绍项目定义、...

2个月前 AI工具箱

178

Stable Audio 3：开源AI音频生成模型，多风格音乐音效创作与音频修复工具

Stable Audio 3是Stability AI研发的开源AI音频生成项目，支持文本生成音乐音效、音频片段修复续写，搭载多款梯度模型，兼容多类硬件设备，具备LoRA风格微调能力，提供网页...

2个月前人工智能研究所

143

Hy-MT2：腾讯混元开源的快思考多语种翻译模型，支持33种语言互译与指令定制翻译

Hy-MT2是腾讯混元开源的快思考多语种翻译模型家族，拥有1.8B、7B、30B-A3B多规格版本，支持33种语言双向翻译与七类指令定制翻译，搭载AngelSlim极致量化技术，体积小巧适配...

2个月前 AI铺子

156

Gemini Omni Flash：谷歌全模态世界模型，推理与创作融合的AI视频生成工具

Gemini Omni Flash是谷歌DeepMind推出的全模态生成式AI模型，支持文本、图片、音频、视频任意组合输入，可生成720P/10秒带同步音频的高清视频。核心具备对话式视频编辑、物...

2个月前 97ai

110

Qwen3.7 Preview：阿里通义千问旗舰预览版，智能体与多模态性能双登顶

Qwen3.7 Preview是阿里巴巴通义千问团队推出的新一代大模型预览版，包含Qwen3.7-Max-Preview（旗舰文本版）与Qwen3.7-Plus-Preview（高性能视觉版）两个核心版本，是Qwen...

2个月前 AI铺子

362

Qwen3.5-LiveTranslate：阿里通义推出的视觉增强实时同声传译大模型，低延迟高准度多模态翻译

Qwen3.5-LiveTranslate是阿里通义实验室推出的视觉增强型实时音视频同声传译大模型，基于Qwen3.5-Omni架构原生打造，核心优势为视觉-音频融合消歧义、2.8秒超低延迟、实时声...