AI新闻资讯 - 最新人工智能技术动态与热点资讯

SongGeneration 2：腾讯、清华大学联合开源的AI音乐大模型，商用级歌曲生成与多语种精准演唱

SongGeneration 2是腾讯AI Lab与清华大学联合研发的开源商用级AI歌曲生成大模型，基于LeVo 2架构，采用LLM与Diffusion混合设计，支持最长4分30秒完整歌曲、多语种精准演唱、...

3天前 AI工具箱

66

Phi-4-reasoning-vision-15B：微软开源15B多模态视觉推理模型，自适应思考与高清图像理解

Phi-4-reasoning-vision-15B是微软开源的150亿参数轻量多模态视觉推理模型，基于“中融合架构”整合视觉感知、文本理解与逻辑推理三大核心能力，具备动态分辨率编码、自适应...

4天前人工智能研究所

73

Mobile-Agent-v3.5：阿里通义开源的多模态多平台GUI自动化智能体框架

Mobile-Agent-v3.5是阿里巴巴通义实验室X-PLUG团队开源的新一代多平台原生GUI智能体基座，依托GUI-Owl-1.5多模态模型家族，实现手机、PC、浏览器的统一自动化操作，具备精准...

4天前 AI铺子

76

Yuan3.0 Ultra：浪潮的开源万亿参数多模态大模型，企业级智能体高效底座

Yuan3.0 Ultra是由浪潮信息YuanLab.ai团队开源的万亿参数级多模态基础大模型，基于MoE混合专家架构，通过LAEP层自适应专家剪枝、RIRM反射抑制奖励、LFA局部滤波注意力三大核...

4天前 97ai

70

HiClaw：开源AI智能体团队系统，IM可视化管控与安全多智能体协同

HiClaw是一款开源的AI智能体团队协作系统，基于OpenClaw构建，采用Manager-Worker架构，内置Matrix即时通讯与Higress AI网关，支持单命令极速部署、安全凭证隔离、8万+社区...

5天前 dotaai

82

肉包（Roubao）：无需电脑的开源AI手机自动化助手，自然语言操控全场景任务

肉包（Roubao）是一款开源的Android AI手机自动化助手，基于Kotlin原生编写，依托视觉语言模型与多Agent协作架构，无需电脑、ADB与Python环境，用户通过自然语言指令即可让...

5天前 AI工具集

80

Symphony：OpenAI开源编码智能体编排框架，自动化任务调度与安全执行

ymphony是OpenAI开源的编码智能体编排框架，可将项目任务转化为隔离、自主的执行流程，让团队专注管理工作而非监督AI智能体，支持任务轮询、环境隔离、自动重试、成果验证与...

5天前 AI工具箱

67

JadeAI：开源AI智能简历生成工具，拖拽编辑+AI全链路优化与多格式一键导出

JadeAI是一款基于Next.js与TypeScript开发的开源AI智能简历构建工具，提供50+专业模板、可视化拖拽编辑、AI一键生成、PDF/图片解析、JD匹配评分、多格式导出等能力，支持Do...

5天前人工智能研究所

74

HY-WU：腾讯混元开源的功能性神经记忆框架，实现实时参数生成与文本引导图像编辑

HY-WU（混元无相）是腾讯混元团队开源的可扩展功能性神经记忆框架，通过推理时实时生成实例级LoRA参数，解决传统模型静态权重导致的灾难性遗忘与性能跷跷板问题，专注文本引...

6天前 AI铺子

86

Faster-Whisper：基于CTranslate2的高性能语音转文本引擎，4倍速推理与低内存占用双突破

Faster-Whisper是由SYSTRAN团队开发并开源的OpenAI Whisper语音转文本模型的高性能重构实现，核心依托CTranslate2——一款专为Transformer架构设计的轻量级、高性能推理引擎...

6天前 97ai

86

AI新闻

热门人工智能技术动态与AI行业资讯