Univer:跨端全栈开源办公工具,支持表格 / 文档 / 幻灯片一体化创建与编辑
Univer是一款开源的全栈办公工具框架,支持在Web和服务器端创建、编辑电子表格(Sheet)、文档(Doc)与幻灯片(Slide),具备同构运行、高性能、可扩展、易嵌入的核心优势...
Univer是一款开源的全栈办公工具框架,支持在Web和服务器端创建、编辑电子表格(Sheet)、文档(Doc)与幻灯片(Slide),具备同构运行、高性能、可扩展、易嵌入的核心优势...
HippoRAG 2 是由俄亥俄州立大学自然语言处理组开发的开源大型语言模型(LLMs)记忆增强框架,核心目标是解决传统 RAG系统在知识关联、复杂上下文整合方面的不足。该框架通过...
Chunkr 是由 Lumina AI 开发的开源文档智能处理工具,核心功能是将 PDF、PPT、Word、图片等复杂文档转化为适用于 RAG 和 LLM(大语言模型)的结构化数据。该项目提供布局分...
Orpheus TTS是由Canopy AI开发的开源文本到语音(TTS)系统,以Llama-3b大型语言模型(LLM)为骨干,突破性地将LLM能力应用于语音合成领域。该项目支持零样本语音克隆、可控...
OmniVinci是由NVIDIA等机构开发的开源全模态理解大语言模型(Omni-Modal Understanding LLM),旨在通过创新架构与高效数据构建,实现对视觉(图像、视频)、音频、文本信息...
GigaBrain-0 是一款开源的视觉 - 语言 - 动作融合模型,以世界模型为核心技术支撑,能够同时处理视觉输入、语言指令和动作输出,实现智能体对动态环境的实时理解与交互。该...
Kotaemon 是一款开源的检索增强生成(RAG)UI 工具,旨在为终端用户提供简洁的文档对话交互界面,同时为开发者提供可定制的 RAG 管道框架。它支持多模型集成(包括 OpenAI、...
OpenPI是由Physical Intelligence团队开源的机器人智能模型工具包,核心目标是降低机器人“感知-理解-动作”全链路技术的开发门槛。它基于10k+小时的真实机器人交互数据,提...
Supermemory是一个开源的“记忆管理系统”,其核心理念是帮助用户构建一个可交互的“数字记忆库”——无论是网页链接、PDF文档、纯文本笔记,还是来自Notion、Google Drive...
Fish Speech(后更名OpenAudio)是由fishaudio团队开发的开源文本转语音(TTS)解决方案,核心基于OpenAudio-S1系列模型,提供高质量语音合成、跨语言语音克隆、情感语气控...
OpenMemory是一款开源、自托管、框架无关的AI记忆引擎,旨在为大型语言模型(LLM)应用提供持久化、结构化和语义化的记忆能力。它通过独特的分层记忆分解(HMD v2)架构,解...
Whisper 是 OpenAI 开发的开源通用语音处理模型,基于 Transformer 架构,通过多任务训练支持多语言语音识别、语音翻译、语言识别等功能。该模型提供 6 种不同规格(从 tin...
Shimmy 是一款基于 Rust 开发的轻量级 OpenAI API 兼容服务器,专注于本地大语言模型(LLM)推理。它以 “无依赖、高性能、隐私优先” 为核心优势,提供 100% 兼容 OpenAI ...
DreamOmni2是一款开源多模态指令驱动图像编辑与生成模型,支持基于文本和图像参考的跨模态内容创作。其核心优势在于统一架构下兼顾生成与编辑任务,能精准保持对象身份、姿...
AgentBoard 是一款开源浏览器扩展,定位为 “浏览器中的 AI 交换机”,支持集成 OpenAI、Anthropic、Google 等主流 AI 模型及本地 Ollama 模型,通过自定义工具脚本(WebMC...