Matrix-3D:昆仑万维(SkyworkAI)开源的全向可探索 3D 世界生成框架
Matrix-3D是由昆仑万维(SkyworkAI)开发的开源3D场景生成框架,专注于实现“全向可探索3D世界”的构建。该项目通过融合全景表示技术、条件视频生成模型与全景3D重建算法,支...
Matrix-3D是由昆仑万维(SkyworkAI)开发的开源3D场景生成框架,专注于实现“全向可探索3D世界”的构建。该项目通过融合全景表示技术、条件视频生成模型与全景3D重建算法,支...
Klavis AI 是一个专注于 AI 代理工具集成的开源项目,通过提供 MCP(Module Communication Protocol)集成层,让 AI 代理能够可靠地使用数千种工具。该项目具备 Strata 统一...
AI-Researcher是由HKUDS开源的科研全流程AI辅助工具,旨在解决传统科研中“文献筛选耗时、实验复现难、数据处理繁琐、协作效率低”等痛点。工具集成智能文献管理、实验自动...
Qwen3-Omni是由阿里达摩院推出的开源全模态基础模型,支持文本、图像、音频、视频等多类型输入,并能实时输出文本或自然语音。该模型采用创新的“Thinker-Talker”架构与Mo...
FLUX是由Black Forest Labs开发的开源图像生成与编辑模型系列,涵盖文本驱动图像生成、图像填充、结构控制等多元功能。该项目通过模块化设计提供高效推理代码,支持开发者与...
Hunyuan-MT是腾讯开源的高性能多语言翻译项目,包含Hunyuan-MT-7B基础模型与Hunyuan-MT-Chimera-7B集成模型,支持33种语言互译(含5种中国少数民族语言)。项目提供完整的训...
Qianfan-VL是百度智能云千帆推出的开源领域增强多模态理解模型系列,涵盖3B、8B、70B三种参数规模,专注于企业级应用场景。该模型系列在保持通用能力的同时,特别强化了文档...
Presentation-AI是一款开源的AI驱动PPT生成工具,旨在帮助用户摆脱传统PPT制作的繁琐流程——无需专业设计能力,只需输入主题、数量等基础信息,AI即可自动生成完整大纲、内...
SpikingBrain-7B是一个受大脑神经机制启发的大型语言模型项目,该项目的核心目标是通过创新的架构设计和技术整合,解决传统大语言模型在计算效率、能耗和长序列处理方面的局...
Stable Diffusion WebUI 是一款针对 Stable Diffusion 模型开发的开源可视化工具,核心目标是 “降低 AI 图像创作门槛”。它通过 Gradio 构建的友好网页界面,将原生 Stabl...
Deep Chat 是一个开源的 AI 聊天组件,旨在为开发者提供高度可定制、功能丰富的聊天界面解决方案。该组件支持文本、语音、文件等多模态交互,可轻松集成 OpenAI、HuggingFa...
OM1是由OpenMind开源的一个模块化的AI运行时系统,专为开发者打造,用于创建和部署能够跨数字环境和物理机器人工作的多模态AI代理。它采用Python设计,具有高度的灵活性和可...
CopilotKit是一款开源的AI助手集成工具包,支持快速将深度集成的AI助手与智能体嵌入各类应用程序。其具备框架无关、UI可灵活定制、内置安全防护等核心优势,提供Headless A...
Opcode 是一款专为 Claude Code 设计的开源桌面应用程序和工具包,该工具提供项目与会话管理、自定义 AI 代理、使用分析仪表板、MCP 服务器管理以及会话时间线与检查点等核...
MiMo-Audio是小米公司开发并开源的音频语言模型项目,旨在通过大规模预训练和创新的模型架构,实现音频领域的少样本学习能力。该项目依托超过1亿小时的多语言、多场景音频数...