Revornix:开源 AI 信息管理工具,多源整合 + 向量存储 + 智能交互一站式解决方案
一、Revornix是什么?
Revornix是一款面向AI时代的开源信息管理工具,致力于帮助用户整合网页、文档、RSS等多源信息,并通过智能处理生成结构化报告。它以本地优先为原则保障数据安全,支持多语言和跨平台使用,具备强大的文本转换、向量存储、知识图谱构建等功能,同时可灵活集成LLM模型,适用于个人知识管理、团队协作、企业信息整合等多种场景,为用户提供高效、安全、可定制的信息管理服务。
作为开源项目,Revornix坚持“本地优先”的原则,用户的数据可以选择本地存储或自托管,有效避免了数据泄露的风险,保障了信息的安全性和隐私性。同时,其开源特性允许用户根据自身需求进行二次开发和定制,具有高度的灵活性和扩展性。
Revornix并非简单的文件存储工具,而是融合了AI技术的智能信息管理系统。它借助多模态大模型、向量数据库、知识图谱等先进技术,实现了信息的自动化处理、精准检索和智能交互,让信息从被动存储转变为主动为用户提供服务,提升了信息的利用效率和价值。
该项目目前处于活跃的开发阶段,已支持Web端使用,iOS应用和微信小程序正在开发中,未来将进一步拓展使用场景,为用户提供更便捷、全面的信息管理体验。
二、功能特色
Revornix凭借其丰富而强大的功能,在信息管理领域展现出独特的优势,以下是其主要功能特色:
1. 多源信息整合,一站式管理
Revornix支持多种信息源的接入,真正实现了“一个平台管理所有信息”,具体包括:
在线内容:可以整合新闻、博客、论坛帖子等,通过内置的daily-hot模块,还能聚合GitHub趋势、HelloGitHub等热门数据;
本地文档:直接上传PDF、Word、Excel、PowerPoint等主流办公文件,无需进行格式转换;
手动输入:支持快速录入笔记、文本片段等,方便用户随时记录灵感、待办事项等信息;
其他来源:可对接API接口、PyPI/Node.js包文档等,满足开发者和专业人士的特殊信息需求。
所有接入的信息会统一存储在用户的专属仓库中,用户可以通过分类标签、阅读状态、收藏星级等方式进行管理,无需在多个平台之间切换,极大地提高了信息管理的效率。
2. 智能文本转换与存储
Revornix在文本处理方面表现出色,依托先进技术实现了高效的转换与存储:
高级格式转换:基于MinerU等引擎,能将PDF、Word、网页等各类文件高质量地转换为Markdown格式,保留原始内容的结构,去除冗余格式,且支持自定义转换引擎;
向量存储:转换后的文档通过嵌入技术生成向量数据,存储在Milvus向量数据库中,实现了基于语义的精准检索,即使用户不记得精确关键词,也能找到相关文档;
知识图谱构建:利用个性化GraphRAG技术,将分散的信息关联起来,形成可视化的知识图谱,帮助用户发现信息之间的隐藏联系,加深对内容的理解。
3. 多租户支持,适配不同场景
Revornix从架构设计上就支持多租户模式,能够满足个人和团队协作的不同需求:
个人用户:拥有独立的文档仓库,可按照个人习惯进行分类、管理,数据完全隔离,保障隐私;
团队用户:可创建共享板块,成员能够共同上传、编辑、评论文档,实现知识的协作与沉淀,管理员可设置成员权限,控制信息访问范围;
并发兼容:优化了多用户并发访问机制,确保多个用户同时操作时系统仍能稳定运行,避免数据冲突和卡顿。
4. 本地优先与开源特性
这是Revornix区别于其他信息管理工具的重要优势:
本地存储:用户可选择将所有数据存储在本地设备或自己的服务器上,不依赖第三方云服务,从根源上降低数据泄露和平台停止服务的风险;
开源透明:源代码完全公开,用户可以查看核心逻辑、修改代码、进行二次开发,以适配自身的特殊需求,同时也能对代码安全性进行审计,避免隐藏的风险。
5. 智能助手与MCP集成
Revornix内置了AI智能助手,并集成了MCP(Multi-Component Protocol)客户端和服务器,实现了信息的深度交互:
文档交互:智能助手可以读取文档内容,回答相关问题、总结核心观点、提取关键信息,甚至生成行动建议;
工具调用:通过MCP协议,助手能够调用本地或第三方工具,如计算器、翻译工具等,实现“信息查询-处理-应用”的闭环,用户也可向他人开放自己的工具或使用社区共享工具;
多模型切换:支持灵活配置LLM模型,不同功能可依赖独立的模型设置,用户可根据需求选择合适的模型,如OpenAI兼容的各类模型。
6. 跨平台与多语言支持
跨平台使用:目前已实现Web端稳定运行,iOS应用和微信小程序正在开发中,未来将实现多终端覆盖,满足用户在不同场景下的使用需求;
多语言适配:支持中英文等多种语言界面,文档内容也支持多语言检索和处理,消除了语言壁垒,方便不同语言背景的用户使用。
7. 丰富的统计与操作功能
可视化统计:提供近一个月文档阅读总结、文档标签分布、未读/已读文档比例等统计图表,帮助用户直观了解信息管理情况;
便捷操作:支持全文检索、标签分类、星标收藏、最近阅读记录等功能,让用户能够快速定位所需信息,界面设计简洁直观,易于上手。

三、技术细节
Revornix的技术架构设计先进,融合了多种成熟技术,确保系统的稳定、高效和可扩展,以下是其技术细节:
1. 整体架构
Revornix采用前后端分离的架构,结合Docker容器化技术简化部署,整体架构分为以下几层:
前端层:负责用户交互,提供响应式界面;
后端API层:处理前端请求,实现核心业务逻辑;
任务处理层:处理异步任务,如文档转换、向量生成等;
数据存储层:包含多种数据库,用于存储不同类型的数据;
基础设施层:提供缓存、对象存储、容器编排等支持。
各层之间通过标准化接口通信,松耦合的设计便于单独升级或扩展某一层功能,提高了系统的稳定性和可维护性。
2. 核心模块与技术栈
Revornix的仓库结构清晰,不同模块采用了适配其功能的技术栈,如下表所示:
| 模块名称 | 核心技术栈 | 主要功能 |
|---|---|---|
| web/ | Next.js、Zustand、Tailwind CSS、TypeScript | 前端界面开发,包括仪表盘、文档管理、搜索等页面,支持响应式设计 |
| api/ | Python、FastAPI、Sequelize、Pydantic | 提供RESTful API,处理用户认证、文档CRUD、检索请求等业务逻辑 |
| celery-worker/ | Python、Celery、Redis | 处理异步任务,如文档格式转换、向量嵌入生成等 |
| daily-hot/ | Hono、TypeScript、Redis | 热门数据聚合API,爬取GitHub趋势等数据源,提供JSON/RSS输出 |
| nginx/ | Nginx | 反向代理、静态资源服务,优化前端访问速度和稳定性 |
3. 数据存储方案
Revornix根据数据类型选择合适的存储引擎,采用多数据库协同的存储方案:
关系型数据库:PostgreSQL,用于存储用户信息、文档元数据、权限配置等结构化数据,通过Sequelize ORM框架简化数据库操作;
向量数据库:Milvus,用于存储文档向量数据,支持高效的语义检索和相似性匹配;
知识图谱数据库:Neo4j,用于存储信息之间的关联关系,支持知识图谱的构建和可视化查询;
缓存数据库:Redis,用于缓存热门检索结果、用户会话信息等,提升系统响应速度;
对象存储:MinIO,用于存储原始文档、转换后的Markdown文件等非结构化数据,支持高可用和扩容。
4. 关键技术实现
(1)文档转换与向量化流程
用户上传文档或接入在线信息源;
前端将文件传输至后端,api模块接收后存入MinIO;
api模块将转换任务提交至Celery队列;
celery-worker模块调用多模态大模型将文档转换为Markdown格式;
调用嵌入模型生成向量数据;
向量数据存入Milvus,Markdown文件存入MinIO,文档元数据更新至PostgreSQL;
用户可通过检索找到该文档。
(2)多租户实现
通过“租户ID”实现数据隔离,在数据库层面,核心数据表包含“tenant_id”字段,查询时自动过滤当前租户数据;在存储层面,不同租户的数据在MinIO和Milvus中分别存储,确保数据安全;在权限层面,基于租户ID和用户角色控制访问权限。
(3)LLM集成机制
采用OpenAI兼容的API接口,支持各类模型接入;用户可通过环境变量或系统设置配置模型参数;不同功能模块可配置不同的LLM模型,兼顾性能和成本;智能助手交互时会自动加载相关文档内容作为上下文,提高回答准确性。
(4)检索功能实现
支持“关键词检索+语义检索”双模式,关键词检索基于数据库索引快速匹配,适合精确查询;语义检索通过Milvus计算查询语句与文档向量的相似度,适合模糊查询;系统可结合两种检索结果排序后返回,兼顾速度和准确性。
5. 部署技术
Revornix提供Docker化部署方案,通过docker-compose.yaml文件定义服务依赖,一键启动所有所需服务;提供环境变量模板,用户只需修改关键参数即可适配自身环境;Docker容器化确保系统可在不同操作系统上稳定运行,也支持云平台一键部署。
四、应用场景
Revornix凭借其强大的功能,适用于多种场景,满足不同用户的需求:
1. 个人知识管理
适合学生、职场人、研究者等需要管理大量资料的人群:
资料整合:将电子书、论文、网页教程等集中存储,告别资料分散的问题;
高效检索:通过关键词或语义检索快速找到所需资料,节省时间;
深度学习:利用智能助手总结文档核心观点,通过知识图谱发现资料间的关联,构建知识体系;
隐私保障:本地部署模式下,个人资料存储在自己的设备上,保障隐私安全。
例如,研究生可以用Revornix整合文献资料,通过语义检索找到相关研究成果,用智能助手总结文献结论,借助知识图谱发现研究脉络,提升科研效率。
2. 团队协作与知识沉淀
适用于中小企业、创业团队、项目组等:
共享知识库:创建团队专属板块,成员共同上传项目文档、会议纪要等,实现知识共享;
协作编辑:成员可对共享文档进行编辑、评论,实时同步更新,避免版本混乱;
权限控制:管理员设置成员权限,确保敏感文档仅授权人员可查看,保障信息安全;
新人培训:新成员通过共享知识库快速了解项目背景和操作流程,缩短培训周期。
比如,软件开发团队可创建“项目文档库”,存储需求文档、设计方案等,开发人员通过检索快速查找信息,测试人员更新测试用例并通知相关人员,实现高效协作。
3. 企业信息整合与管理
可作为企业内部信息中枢,解决信息管理难题:
多源信息聚合:整合企业内部系统文档、外部行业新闻、政策文件等,形成全面信息库;
智能检索与分析:员工通过语义检索快速找到所需信息,智能助手分析行业新闻提供决策参考;
数据安全可控:本地部署满足数据合规要求,开源特性允许安全审计和定制化修改;
知识传承:将员工的工作经验、项目案例等沉淀为企业知识库,避免知识流失。
像制造企业可以用Revornix整合产品手册、生产流程文档等,生产部门员工快速查询操作规范,市场部门分析行业趋势,管理层了解企业知识沉淀情况。
4. 开发者信息管理
特别适合开发者解决工作中的信息管理问题:
技术文档整合:聚合编程语言文档、框架手册等,通过检索快速查找使用方法;
代码片段管理:存储常用代码片段、配置文件等,添加标签分类,方便复用;
开源项目跟踪:通过daily-hot模块订阅GitHub趋势等,及时了解开源社区动态;
本地开发适配:支持本地部署,与本地开发环境无缝衔接,可二次开发集成到IDE中。
例如,前端开发者可存储React、Vue等框架文档,收藏常用CSS样式代码片段,订阅前端热门开源项目,通过智能助手解决开发问题。
5. 科研与学术资料管理
方便科研人员和学生管理学术资料:
文献整合:集中存储论文、期刊文章等,支持多种格式,避免文件丢失;
语义检索:通过关键词或语义查询相关文献,无需手动筛选;
笔记与批注:在文档中添加笔记、批注,记录阅读心得,支持Markdown格式;
知识图谱:通过GraphRAG技术关联不同文献,发现研究领域的发展脉络等,为科研选题提供参考。
博士生可用Revornix管理研究方向的文献,通过语义检索找到相关内容,用知识图谱分析领域热点,提升论文写作效率。

五、使用方法
Revornix提供Docker部署和手动部署两种方式,以下是详细的使用步骤:
1. 前置条件
操作系统:支持Windows、Linux、MacOS,推荐Linux或MacOS;
软件依赖:Docker(Docker部署)、Git、Python 3.8+(手动部署)、Node.js 16+(前端构建);
硬件要求:建议CPU≥4核,内存≥8GB;
网络要求:部署时需联网下载依赖,部分功能需持续联网。
2. Docker部署(推荐)
(1)克隆仓库
打开终端,执行命令:
git clone git@github.com:Qingyon-AI/Revornix.git cd Revornix
若无SSH密钥,使用HTTPS地址:
git clone https://github.com/Qingyon-AI/Revornix.git cd Revornix
(2)配置环境变量
复制模板文件生成.env文件:
cp .env.example .env
编辑.env文件,配置核心参数,如OAUTH_SECRET_KEY,确保不同服务使用相同值。
(3)启动Docker服务
执行命令拉取镜像并启动服务:
docker compose up -d
首次启动可能需要较长时间,等待服务启动完成。
(4)访问系统
打开浏览器,访问http://localhost进入前端页面。若无法访问,查看后端api服务状态:
docker compose logs api
3. 手动部署(适合深度定制)
(1)克隆仓库
同Docker部署步骤(1)。
(2)配置依赖服务
手动启动PostgreSQL、Redis、Milvus、Neo4j、MinIO等依赖服务,记录连接信息。
(3)配置环境变量
复制.env.example为.env,修改依赖服务连接参数。
(4)启动后端服务
安装Python依赖:
cd api pip install -r requirements.txt
初始化数据库:
python manage.py migrate
启动API服务:
uvicorn main:app --host 0.0.0.0 --port 8000
启动Celery worker(新终端):
cd api celery -A worker worker --loglevel=info
(5)启动前端服务
安装Node.js依赖:
cd web npm install
构建并启动前端服务:
npm run build npm run start
(6)访问系统
访问http://localhost:3000进入系统。
4. 基本操作指南
(1)注册与登录
首次访问注册账号,输入用户名、密码完成注册,然后登录进入仪表盘。
(2)添加文档
上传本地文档:点击“Add Document”按钮,选择文件上传;
添加在线内容:输入网页链接、RSS地址等,系统自动抓取内容;
手动添加笔记:直接输入文本内容,支持Markdown格式。
(3)管理文档
分类标签:为文档添加标签,便于分类;
阅读状态:标记“已读”或“未读”;
星标收藏:对重要文档星标收藏;
搜索文档:使用顶部搜索框查询相关文档。
(4)使用智能助手
在文档详情页或仪表盘点击“AI Assistant”,可提问、调用工具、切换模型等。
(5)创建共享板块
团队用户点击“Sections”→“Create”,输入名称和描述,设置成员权限并邀请成员加入。
六、常见问题解答(FAQ)
1. 部署后前端无法访问或无法连接后端怎么办?
检查后端api服务状态,通过
docker compose logs api(Docker部署)或查看API日志(手动部署)确认是否启动;若后端未启动,检查依赖服务是否正常运行,重启异常容器;
若后端已启动,可能是端口被占用,修改docker-compose.yaml中的端口映射后重启服务。
2. 支持哪些文件格式上传?
目前支持PDF、Word(.docx)、Excel(.xlsx)、PowerPoint(.pptx)、纯文本文件(.txt)、Markdown文件(.md),未来将扩展更多格式。
3. 如何备份和恢复本地存储的数据?
备份:Docker部署时,通过
docker volume inspect查看卷路径,复制文件备份;手动部署时,备份各数据库数据目录;恢复:将备份文件复制到对应目录,重启服务即可,建议定期备份。
4. 能否部署在云服务器供多人远程访问?
可以,部署步骤与本地一致,需注意开放相关端口,建议配置HTTPS保障安全,提升服务器配置应对并发访问,设置高强度OAUTH_SECRET_KEY。
5. 如何自定义LLM模型,比如使用本地部署的Llama 3?
确保本地模型支持OpenAI兼容接口;
进入系统设置→LLM配置,输入模型API地址,无需填写API密钥;
保存配置后即可使用该模型。
6. 非技术人员能否使用Revornix?
可以,Docker部署简化了配置步骤,非技术人员按教程执行命令即可部署,系统界面简洁,基本操作无需编程基础,遇到问题可加入社区寻求帮助。
7. Revornix是免费的吗?商业使用有什么限制?
Revornix开源且遵循Apache License 2.0协议,个人和非商业用途免费;商业用途采用多租户模式需获取商业许可,不得移除前端LOGO和版权信息,二次开发用于商业用途需注明基于Revornix开发。
七、相关链接
八、总结
Revornix作为一款面向AI时代的开源信息管理工具,凭借多源信息整合、智能处理、本地优先、多租户支持等特性,为个人、团队和企业提供了高效、安全、可定制的信息管理解决方案。其先进的技术架构和丰富的功能,使其在知识管理、团队协作、企业信息整合等场景中发挥重要作用,且开源特性为用户提供了广阔的二次开发空间,是一款极具实用价值和发展潜力的信息管理工具。
版权及免责申明:本文由@97ai原创发布。该文章观点仅代表作者本人,不代表本站立场。本站不承担任何相关法律责任。
如若转载,请注明出处:https://www.aipuzi.cn/ai-news/revornix.html

