GigaWorld-1:极佳视界开源的高精度物理交互AI世界模型
GigaWorld-1是国内科技企业极佳视界自主研发的新一代动作控制类具身世界模型(AC-WM),聚焦物理世界AI交互与智能体动作模拟,是面向机器人、自动化设备、物理仿真场景打造...
GigaWorld-1是国内科技企业极佳视界自主研发的新一代动作控制类具身世界模型(AC-WM),聚焦物理世界AI交互与智能体动作模拟,是面向机器人、自动化设备、物理仿真场景打造...
MicroCoder是由微软亚洲研究院、剑桥大学、普林斯顿大学联合开源的AI 代码模型专属强化学习库,聚焦解决现代代码大模型(如Qwen 2.5、Qwen 3系列)训练中的代际断层、数据集...
Pascal Editor是一款基于React Three Fiber与WebGPU开发的开源3D建筑编辑器,采用Turborepo单体仓库架构,实现数据层、渲染层、应用层解耦。它无需安装客户端,浏览器直接运...
Wecom-cli是由企业微信官方WecomTeam团队推出的开源命令行交互工具,依托Rust语言底层开发,核心定位为实现人类开发者与AI智能体(AI Agent)均可通过终端界面,直接调用企...
Gemini 3.1 Flash Live是谷歌于2026年3月发布的高性能实时语音生成模型,作为Gemini体系中专注实时音频交互的核心产品,它以毫秒级低延迟、高精度语音理解与生成、长上下文...
Voxtral TTS是法国AI公司Mistral AI于2026年3月发布的首款开源文本转语音(Text-to-Speech, TTS)模型,也是业界首个专为企业级应用设计、具备前沿质量的开放权重TTS模型。
Suno v5.5是Suno公司于2026年3月推出的新一代AI音乐生成大模型,官方称其为“表现力最强、最符合个性”的版本。该模型实现从“一键生成即结束”到“生成+精修”的专业级音乐...
LongCat-Next是美团旗下LongCat(龙猫)团队开源的原生多模态基础大模型,核心摒弃传统多模态模型“语言基座外挂视觉、音频模块”的拼凑式架构,创新性打造纯离散自回归底层...
Lark-Cli是字节跳动飞书开放平台官方推出的开源命令行工具,其基于Go语言核心开发,同时兼容Node.js生态部署,是衔接终端操作、开发者开发与AI智能体自动化办公的核心桥梁。...
Star Office UI是一款开源像素风格的AI办公室可视化看板项目,主打AI智能体工作状态实时可视化展示,深度兼容OpenClaw框架,支持多智能体协同办公、六大工作状态动态切换、...