StepAudio 2.5 ASR:阶跃星辰开源的轻量化语音识别模型
StepAudio 2.5 ASR 是由阶跃星辰基于前代模型架构全面优化升级而来的一款面向端侧与轻量化部署的开源自动语音识别(ASR)模型迭代版本,聚焦低成本、低算力、高适配的语音转...
StepAudio 2.5 ASR 是由阶跃星辰基于前代模型架构全面优化升级而来的一款面向端侧与轻量化部署的开源自动语音识别(ASR)模型迭代版本,聚焦低成本、低算力、高适配的语音转...
Claude Design 是人工智能企业 Anthropic 基于 Claude 系列大语言模型深度研发打造的AI原生一体化视觉设计创作工具,深度融合自然语言理解、多模态识别、视觉元素生成、版式...
Seed3D 2.0 是字节跳动重磅迭代升级的第二代端到端通用3D生成大模型,依托字节多年多模态大模型技术沉淀打造,聚焦解决传统AI三维生成模型几何结构畸形、边缘细节模糊、材质...
buffett-skills(简称bft-skills)是由agi-now团队开源的Claude Code专用技能集合仓库,核心定位是将沃伦·巴菲特60余年验证有效的价值投资框架,转化为可被Claude Code智能...
OpenGame 全称为 Open Agentic Coding for Games,是由香港中文大学 MMLab 实验室团队研发并开源发布的首款专门面向游戏场景的智能编码代理框架,核心核心定位是依托大模型...
DeepSeek-V4是深度求索(DeepSeek)于2026年4月推出的新一代开源混合专家(MoE)大语言模型,分为V4-Pro(1.6T总参数)与V4-Flash(284B总参数)双版本,全系标配100万Toke...
Khazix Skills 是由数字生命卡兹克独立开源维护的AI Skills合集项目,该项目核心定位为个人实战级AI能力封装库,所有内置Skill均为创作者长期日常工作、内容创作、智能体实...
融光(ai-fusion-video) 是一款的开源全流程AI视频创作平台,以"让每个人都能轻松制作专业视频"为核心目标。不同于市面上单一功能的AI视频生成工具,融光构建了完整的视频...
MOSS-TTS-Nano 是由 OpenMOSS 团队开源的一款超轻量级多语言文本转语音(TTS)模型,依托 MOSS 大模型生态构建,主打小体积、低延迟、低硬件门槛与高音质输出,是面向端侧设...
ClawLess是南方科技大学与香港科技大学联合发布的AI智能体专用形式化安全框架,聚焦大模型驱动自主AI智能体的越权、逃逸、数据泄露等核心风险,在最坏威胁模型下,通过形式...