Revornix:开源 AI 信息管理工具,多源整合 + 向量存储 + 智能交互一站式解决方案

原创 发布日期:
6

一、Revornix是什么?

Revornix是一款面向AI时代的开源信息管理工具,致力于帮助用户整合网页、文档、RSS等多源信息,并通过智能处理生成结构化报告。它以本地优先为原则保障数据安全,支持多语言和跨平台使用,具备强大的文本转换、向量存储、知识图谱构建等功能,同时可灵活集成LLM模型,适用于个人知识管理、团队协作、企业信息整合等多种场景,为用户提供高效、安全、可定制的信息管理服务。

作为开源项目,Revornix坚持“本地优先”的原则,用户的数据可以选择本地存储或自托管,有效避免了数据泄露的风险,保障了信息的安全性和隐私性。同时,其开源特性允许用户根据自身需求进行二次开发和定制,具有高度的灵活性和扩展性。

Revornix并非简单的文件存储工具,而是融合了AI技术的智能信息管理系统。它借助多模态大模型、向量数据库、知识图谱等先进技术,实现了信息的自动化处理、精准检索和智能交互,让信息从被动存储转变为主动为用户提供服务,提升了信息的利用效率和价值。

该项目目前处于活跃的开发阶段,已支持Web端使用,iOS应用和微信小程序正在开发中,未来将进一步拓展使用场景,为用户提供更便捷、全面的信息管理体验。

二、功能特色

Revornix凭借其丰富而强大的功能,在信息管理领域展现出独特的优势,以下是其主要功能特色:

1. 多源信息整合,一站式管理

Revornix支持多种信息源的接入,真正实现了“一个平台管理所有信息”,具体包括:

  • 在线内容:可以整合新闻、博客、论坛帖子等,通过内置的daily-hot模块,还能聚合GitHub趋势、HelloGitHub等热门数据;

  • 本地文档:直接上传PDF、Word、Excel、PowerPoint等主流办公文件,无需进行格式转换;

  • 手动输入:支持快速录入笔记、文本片段等,方便用户随时记录灵感、待办事项等信息;

  • 其他来源:可对接API接口、PyPI/Node.js包文档等,满足开发者和专业人士的特殊信息需求。

所有接入的信息会统一存储在用户的专属仓库中,用户可以通过分类标签、阅读状态、收藏星级等方式进行管理,无需在多个平台之间切换,极大地提高了信息管理的效率。

2. 智能文本转换与存储

Revornix在文本处理方面表现出色,依托先进技术实现了高效的转换与存储:

  • 高级格式转换:基于MinerU等引擎,能将PDF、Word、网页等各类文件高质量地转换为Markdown格式,保留原始内容的结构,去除冗余格式,且支持自定义转换引擎;

  • 向量存储:转换后的文档通过嵌入技术生成向量数据,存储在Milvus向量数据库中,实现了基于语义的精准检索,即使用户不记得精确关键词,也能找到相关文档;

  • 知识图谱构建:利用个性化GraphRAG技术,将分散的信息关联起来,形成可视化的知识图谱,帮助用户发现信息之间的隐藏联系,加深对内容的理解。

3. 多租户支持,适配不同场景

Revornix从架构设计上就支持多租户模式,能够满足个人和团队协作的不同需求:

  • 个人用户:拥有独立的文档仓库,可按照个人习惯进行分类、管理,数据完全隔离,保障隐私;

  • 团队用户:可创建共享板块,成员能够共同上传、编辑、评论文档,实现知识的协作与沉淀,管理员可设置成员权限,控制信息访问范围;

  • 并发兼容:优化了多用户并发访问机制,确保多个用户同时操作时系统仍能稳定运行,避免数据冲突和卡顿。

4. 本地优先与开源特性

这是Revornix区别于其他信息管理工具的重要优势:

  • 本地存储:用户可选择将所有数据存储在本地设备或自己的服务器上,不依赖第三方云服务,从根源上降低数据泄露和平台停止服务的风险;

  • 开源透明:源代码完全公开,用户可以查看核心逻辑、修改代码、进行二次开发,以适配自身的特殊需求,同时也能对代码安全性进行审计,避免隐藏的风险。

5. 智能助手与MCP集成

Revornix内置了AI智能助手,并集成了MCP(Multi-Component Protocol)客户端和服务器,实现了信息的深度交互:

  • 文档交互:智能助手可以读取文档内容,回答相关问题、总结核心观点、提取关键信息,甚至生成行动建议;

  • 工具调用:通过MCP协议,助手能够调用本地或第三方工具,如计算器、翻译工具等,实现“信息查询-处理-应用”的闭环,用户也可向他人开放自己的工具或使用社区共享工具;

  • 多模型切换:支持灵活配置LLM模型,不同功能可依赖独立的模型设置,用户可根据需求选择合适的模型,如OpenAI兼容的各类模型。

6. 跨平台与多语言支持

  • 跨平台使用:目前已实现Web端稳定运行,iOS应用和微信小程序正在开发中,未来将实现多终端覆盖,满足用户在不同场景下的使用需求;

  • 多语言适配:支持中英文等多种语言界面,文档内容也支持多语言检索和处理,消除了语言壁垒,方便不同语言背景的用户使用。

7. 丰富的统计与操作功能

  • 可视化统计:提供近一个月文档阅读总结、文档标签分布、未读/已读文档比例等统计图表,帮助用户直观了解信息管理情况;

  • 便捷操作:支持全文检索、标签分类、星标收藏、最近阅读记录等功能,让用户能够快速定位所需信息,界面设计简洁直观,易于上手。

Revornix:开源 AI 信息管理工具,多源整合 + 向量存储 + 智能交互一站式解决方案

三、技术细节

Revornix的技术架构设计先进,融合了多种成熟技术,确保系统的稳定、高效和可扩展,以下是其技术细节:

1. 整体架构

Revornix采用前后端分离的架构,结合Docker容器化技术简化部署,整体架构分为以下几层:

  • 前端层:负责用户交互,提供响应式界面;

  • 后端API层:处理前端请求,实现核心业务逻辑;

  • 任务处理层:处理异步任务,如文档转换、向量生成等;

  • 数据存储层:包含多种数据库,用于存储不同类型的数据;

  • 基础设施层:提供缓存、对象存储、容器编排等支持。

各层之间通过标准化接口通信,松耦合的设计便于单独升级或扩展某一层功能,提高了系统的稳定性和可维护性。

2. 核心模块与技术栈

Revornix的仓库结构清晰,不同模块采用了适配其功能的技术栈,如下表所示:

模块名称 核心技术栈 主要功能
web/ Next.js、Zustand、Tailwind CSS、TypeScript 前端界面开发,包括仪表盘、文档管理、搜索等页面,支持响应式设计
api/ Python、FastAPI、Sequelize、Pydantic 提供RESTful API,处理用户认证、文档CRUD、检索请求等业务逻辑
celery-worker/ Python、Celery、Redis 处理异步任务,如文档格式转换、向量嵌入生成等
daily-hot/ Hono、TypeScript、Redis 热门数据聚合API,爬取GitHub趋势等数据源,提供JSON/RSS输出
nginx/ Nginx 反向代理、静态资源服务,优化前端访问速度和稳定性

3. 数据存储方案

Revornix根据数据类型选择合适的存储引擎,采用多数据库协同的存储方案:

  • 关系型数据库:PostgreSQL,用于存储用户信息、文档元数据、权限配置等结构化数据,通过Sequelize ORM框架简化数据库操作;

  • 向量数据库:Milvus,用于存储文档向量数据,支持高效的语义检索和相似性匹配;

  • 知识图谱数据库:Neo4j,用于存储信息之间的关联关系,支持知识图谱的构建和可视化查询;

  • 缓存数据库:Redis,用于缓存热门检索结果、用户会话信息等,提升系统响应速度;

  • 对象存储:MinIO,用于存储原始文档、转换后的Markdown文件等非结构化数据,支持高可用和扩容。

4. 关键技术实现

(1)文档转换与向量化流程

  1. 用户上传文档或接入在线信息源;

  2. 前端将文件传输至后端,api模块接收后存入MinIO;

  3. api模块将转换任务提交至Celery队列;

  4. celery-worker模块调用多模态大模型将文档转换为Markdown格式;

  5. 调用嵌入模型生成向量数据;

  6. 向量数据存入Milvus,Markdown文件存入MinIO,文档元数据更新至PostgreSQL;

  7. 用户可通过检索找到该文档。

(2)多租户实现

通过“租户ID”实现数据隔离,在数据库层面,核心数据表包含“tenant_id”字段,查询时自动过滤当前租户数据;在存储层面,不同租户的数据在MinIO和Milvus中分别存储,确保数据安全;在权限层面,基于租户ID和用户角色控制访问权限。

(3)LLM集成机制

采用OpenAI兼容的API接口,支持各类模型接入;用户可通过环境变量或系统设置配置模型参数;不同功能模块可配置不同的LLM模型,兼顾性能和成本;智能助手交互时会自动加载相关文档内容作为上下文,提高回答准确性。

(4)检索功能实现

支持“关键词检索+语义检索”双模式,关键词检索基于数据库索引快速匹配,适合精确查询;语义检索通过Milvus计算查询语句与文档向量的相似度,适合模糊查询;系统可结合两种检索结果排序后返回,兼顾速度和准确性。

5. 部署技术

Revornix提供Docker化部署方案,通过docker-compose.yaml文件定义服务依赖,一键启动所有所需服务;提供环境变量模板,用户只需修改关键参数即可适配自身环境;Docker容器化确保系统可在不同操作系统上稳定运行,也支持云平台一键部署。

四、应用场景

Revornix凭借其强大的功能,适用于多种场景,满足不同用户的需求:

1. 个人知识管理

适合学生、职场人、研究者等需要管理大量资料的人群:

  • 资料整合:将电子书、论文、网页教程等集中存储,告别资料分散的问题;

  • 高效检索:通过关键词或语义检索快速找到所需资料,节省时间;

  • 深度学习:利用智能助手总结文档核心观点,通过知识图谱发现资料间的关联,构建知识体系;

  • 隐私保障:本地部署模式下,个人资料存储在自己的设备上,保障隐私安全。

例如,研究生可以用Revornix整合文献资料,通过语义检索找到相关研究成果,用智能助手总结文献结论,借助知识图谱发现研究脉络,提升科研效率。

2. 团队协作与知识沉淀

适用于中小企业、创业团队、项目组等:

  • 共享知识库:创建团队专属板块,成员共同上传项目文档、会议纪要等,实现知识共享;

  • 协作编辑:成员可对共享文档进行编辑、评论,实时同步更新,避免版本混乱;

  • 权限控制:管理员设置成员权限,确保敏感文档仅授权人员可查看,保障信息安全;

  • 新人培训:新成员通过共享知识库快速了解项目背景和操作流程,缩短培训周期。

比如,软件开发团队可创建“项目文档库”,存储需求文档、设计方案等,开发人员通过检索快速查找信息,测试人员更新测试用例并通知相关人员,实现高效协作。

3. 企业信息整合与管理

可作为企业内部信息中枢,解决信息管理难题:

  • 多源信息聚合:整合企业内部系统文档、外部行业新闻、政策文件等,形成全面信息库;

  • 智能检索与分析:员工通过语义检索快速找到所需信息,智能助手分析行业新闻提供决策参考;

  • 数据安全可控:本地部署满足数据合规要求,开源特性允许安全审计和定制化修改;

  • 知识传承:将员工的工作经验、项目案例等沉淀为企业知识库,避免知识流失。

像制造企业可以用Revornix整合产品手册、生产流程文档等,生产部门员工快速查询操作规范,市场部门分析行业趋势,管理层了解企业知识沉淀情况。

4. 开发者信息管理

特别适合开发者解决工作中的信息管理问题:

  • 技术文档整合:聚合编程语言文档、框架手册等,通过检索快速查找使用方法;

  • 代码片段管理:存储常用代码片段、配置文件等,添加标签分类,方便复用;

  • 开源项目跟踪:通过daily-hot模块订阅GitHub趋势等,及时了解开源社区动态;

  • 本地开发适配:支持本地部署,与本地开发环境无缝衔接,可二次开发集成到IDE中。

例如,前端开发者可存储React、Vue等框架文档,收藏常用CSS样式代码片段,订阅前端热门开源项目,通过智能助手解决开发问题。

5. 科研与学术资料管理

方便科研人员和学生管理学术资料:

  • 文献整合:集中存储论文、期刊文章等,支持多种格式,避免文件丢失;

  • 语义检索:通过关键词或语义查询相关文献,无需手动筛选;

  • 笔记与批注:在文档中添加笔记、批注,记录阅读心得,支持Markdown格式;

  • 知识图谱:通过GraphRAG技术关联不同文献,发现研究领域的发展脉络等,为科研选题提供参考。

博士生可用Revornix管理研究方向的文献,通过语义检索找到相关内容,用知识图谱分析领域热点,提升论文写作效率。

Revornix:开源 AI 信息管理工具,多源整合 + 向量存储 + 智能交互一站式解决方案

五、使用方法

Revornix提供Docker部署和手动部署两种方式,以下是详细的使用步骤:

1. 前置条件

  • 操作系统:支持Windows、Linux、MacOS,推荐Linux或MacOS;

  • 软件依赖:Docker(Docker部署)、Git、Python 3.8+(手动部署)、Node.js 16+(前端构建);

  • 硬件要求:建议CPU≥4核,内存≥8GB;

  • 网络要求:部署时需联网下载依赖,部分功能需持续联网。

2. Docker部署(推荐)

(1)克隆仓库

打开终端,执行命令:

git clone git@github.com:Qingyon-AI/Revornix.git
cd Revornix

若无SSH密钥,使用HTTPS地址:

git clone https://github.com/Qingyon-AI/Revornix.git
cd Revornix

(2)配置环境变量

复制模板文件生成.env文件:

cp .env.example .env

编辑.env文件,配置核心参数,如OAUTH_SECRET_KEY,确保不同服务使用相同值。

(3)启动Docker服务

执行命令拉取镜像并启动服务:

docker compose up -d

首次启动可能需要较长时间,等待服务启动完成。

(4)访问系统

打开浏览器,访问http://localhost进入前端页面。若无法访问,查看后端api服务状态:

docker compose logs api

3. 手动部署(适合深度定制)

(1)克隆仓库

同Docker部署步骤(1)。

(2)配置依赖服务

手动启动PostgreSQL、Redis、Milvus、Neo4j、MinIO等依赖服务,记录连接信息。

(3)配置环境变量

复制.env.example为.env,修改依赖服务连接参数。

(4)启动后端服务

安装Python依赖:

cd api
pip install -r requirements.txt

初始化数据库:

python manage.py migrate

启动API服务:

uvicorn main:app --host 0.0.0.0 --port 8000

启动Celery worker(新终端):

cd api
celery -A worker worker --loglevel=info

(5)启动前端服务

安装Node.js依赖:

cd web
npm install

构建并启动前端服务:

npm run build
npm run start

(6)访问系统

访问http://localhost:3000进入系统。

4. 基本操作指南

(1)注册与登录

首次访问注册账号,输入用户名、密码完成注册,然后登录进入仪表盘。

(2)添加文档

  • 上传本地文档:点击“Add Document”按钮,选择文件上传;

  • 添加在线内容:输入网页链接、RSS地址等,系统自动抓取内容;

  • 手动添加笔记:直接输入文本内容,支持Markdown格式。

(3)管理文档

  • 分类标签:为文档添加标签,便于分类;

  • 阅读状态:标记“已读”或“未读”;

  • 星标收藏:对重要文档星标收藏;

  • 搜索文档:使用顶部搜索框查询相关文档。

(4)使用智能助手

在文档详情页或仪表盘点击“AI Assistant”,可提问、调用工具、切换模型等。

(5)创建共享板块

团队用户点击“Sections”→“Create”,输入名称和描述,设置成员权限并邀请成员加入。

六、常见问题解答(FAQ)

1. 部署后前端无法访问或无法连接后端怎么办?

  • 检查后端api服务状态,通过docker compose logs api(Docker部署)或查看API日志(手动部署)确认是否启动;

  • 若后端未启动,检查依赖服务是否正常运行,重启异常容器;

  • 若后端已启动,可能是端口被占用,修改docker-compose.yaml中的端口映射后重启服务。

2. 支持哪些文件格式上传?

目前支持PDF、Word(.docx)、Excel(.xlsx)、PowerPoint(.pptx)、纯文本文件(.txt)、Markdown文件(.md),未来将扩展更多格式。

3. 如何备份和恢复本地存储的数据?

  • 备份:Docker部署时,通过docker volume inspect查看卷路径,复制文件备份;手动部署时,备份各数据库数据目录;

  • 恢复:将备份文件复制到对应目录,重启服务即可,建议定期备份。

4. 能否部署在云服务器供多人远程访问?

可以,部署步骤与本地一致,需注意开放相关端口,建议配置HTTPS保障安全,提升服务器配置应对并发访问,设置高强度OAUTH_SECRET_KEY

5. 如何自定义LLM模型,比如使用本地部署的Llama 3?

  • 确保本地模型支持OpenAI兼容接口;

  • 进入系统设置→LLM配置,输入模型API地址,无需填写API密钥;

  • 保存配置后即可使用该模型。

6. 非技术人员能否使用Revornix?

可以,Docker部署简化了配置步骤,非技术人员按教程执行命令即可部署,系统界面简洁,基本操作无需编程基础,遇到问题可加入社区寻求帮助。

7. Revornix是免费的吗?商业使用有什么限制?

Revornix开源且遵循Apache License 2.0协议,个人和非商业用途免费;商业用途采用多租户模式需获取商业许可,不得移除前端LOGO和版权信息,二次开发用于商业用途需注明基于Revornix开发。

七、相关链接

八、总结

Revornix作为一款面向AI时代的开源信息管理工具,凭借多源信息整合、智能处理、本地优先、多租户支持等特性,为个人、团队和企业提供了高效、安全、可定制的信息管理解决方案。其先进的技术架构和丰富的功能,使其在知识管理、团队协作、企业信息整合等场景中发挥重要作用,且开源特性为用户提供了广阔的二次开发空间,是一款极具实用价值和发展潜力的信息管理工具。

打赏
THE END
作者头像
97ai
我不是在训练模型,而是在与未来的自己对话。