AI新闻资讯 - 最新人工智能技术动态与热点资讯

Multimodal-Search-R1：字节跳动开源的端到端多模态搜索强化学习框架

Multimodal-Search-R1（简称MMSearch-R1）是一款开源的端到端强化学习框架，核心定位是让多模态大语言模型（LMMs）具备按需、多轮、自主的真实世界多模态搜索能力，解决传统...

1个月前人工智能研究所

91

Pixel Reasoner：开源7B级像素空间视觉推理模型，解锁多模态精细感知与主动视觉操作

Pixel Reasoner是由滑铁卢大学、香港科技大学、中国科学技术大学及Vector Institute联合TIGER-AI-Lab研发的开源视觉语言模型（VLM）项目，基于Qwen2.5-VL架构搭建，首创像素...

1个月前 AI铺子

72

LLaMA-Factory：一站式大模型高效微调框架，零代码适配百种模型与全流程训练

LLaMA-Factory是一站式统一高效大语言模型与多模态模型微调框架，项目核心目标是降低大模型定制化训练的技术门槛，让零基础用户、开发者、科研人员与企业工程师，都能在无需...

1个月前 97ai

107

TTT - Discover：斯坦福与英伟达联合提出的测试时训练框架

TTT - Discover是由斯坦福大学和英伟达研究团队联合提出的测试时训练框架，其核心创新在于突破传统AI推理阶段冻结模型参数的局限，在测试阶段针对单个具体问题通过强化学习...

1个月前 dotaai

97

SkyReels-V3：昆仑天工开源的全能多模态视频生成模型，覆盖图生视频、音生视频与视频扩展

SkyReels V3是昆仑万维旗下Skywork AI团队自主研发的第三代旗舰多模态视频生成模型，基于统一多模态上下文学习框架与扩散Transformer架构打造，原生集成参考图像生成视频、...

1个月前 AI工具集

127

Qwen3-ASR：通义千问开源的多语言语音识别套件，覆盖52种语种方言与高精度强制对齐

Qwen3-ASR是由阿里云通义千问（QwenLM）团队完全开源的一站式语音识别（ASR）与语音-文本强制对齐解决方案，基于Qwen3-Omni多模态大模型基座研发，是一套集语音转写、语言自...

1个月前 AI工具箱

126

SenseNova-MARS：商汤科技开源的多模态智能体框架，实现动态视觉推理与多工具协同搜索

SenseNova-MARS是商汤科技开源的多模态智能体推理与搜索框架，以强化学习为核心技术，赋予视觉语言模型动态视觉推理与图像裁剪、图像搜索、文本搜索多工具协同调用能力，提...

1个月前人工智能研究所

101

UnifoLM-VLA-0：宇树科技开源的通用人形机器人VLA大模型，实现空间语义增强与多任务操作泛化

UnifoLM-VLA-0是宇树科技UnifoLM模型家族中，面向通用人形机器人操作的视觉-语言-动作（VLA）大模型，也是当前具身智能领域聚焦物理交互的核心开源框架。该模型通过在专业机...

1个月前 AI铺子

142

MOVA：开源音视频同步生成基础模型，原生双模态同生与高精度唇形对齐

MOVA是由OpenMOSS团队研发的开源音视频同步生成基础模型，其采用非对称双塔架构与双向交叉注意力机制，在多语言唇形同步、环境音效匹配上达到领先水平，全栈开放模型权重、...

1个月前 97ai

130

ClawdBot 正式更名为 OpenClaw：聚焦开源、安全与跨平台智能代理演进

近日，广受关注的本地化AI代理项目完成重要里程碑式升级：原名为 ClawdBot（后短暂使用过 Moltbot）的开源项目，已正式定名并全面启用新名称——OpenClaw。这一更名并非简单...

1个月前 AI铺子

152

AI新闻

热门人工智能技术动态与AI行业资讯

Multimodal-Search-R1：字节跳动开源的端到端多模态搜索强化学习框架

Pixel Reasoner：开源7B级像素空间视觉推理模型，解锁多模态精细感知与主动视觉操作

LLaMA-Factory：一站式大模型高效微调框架，零代码适配百种模型与全流程训练

TTT - Discover：斯坦福与英伟达联合提出的测试时训练框架

SkyReels-V3：昆仑天工开源的全能多模态视频生成模型，覆盖图生视频、音生视频与视频扩展

Qwen3-ASR：通义千问开源的多语言语音识别套件，覆盖52种语种方言与高精度强制对齐

SenseNova-MARS：商汤科技开源的多模态智能体框架，实现动态视觉推理与多工具协同搜索

UnifoLM-VLA-0：宇树科技开源的通用人形机器人VLA大模型，实现空间语义增强与多任务操作泛化

MOVA：开源音视频同步生成基础模型，原生双模态同生与高精度唇形对齐

ClawdBot 正式更名为 OpenClaw：聚焦开源、安全与跨平台智能代理演进