MineContext:火山引擎推出的开源主动式上下文感知 AI 助手

原创 发布日期:
11

一、MineContext是什么?

MineContext是由火山引擎(volcengine)开发并开源的主动式上下文感知AI助手,旨在解决用户在信息爆炸时代面临的“上下文分散、关键信息难提取、创作时灵感断层”等问题。项目灵感源自沙盒游戏《Minecraft》(我的世界)——如同游戏中通过方块搭建世界,MineContext将用户的文档、截图、聊天记录、音视频片段等分散信息视为“信息方块”,支持用户对这些“方块”进行收集、整合、再创作,最终形成结构化的个人知识体系。

作为开源项目,MineContext的核心定位是“以用户为中心的上下文工程平台”,既不依赖单一数据源,也不强制绑定特定AI模型,而是通过模块化设计支持多模态数据处理与多后端扩展,同时坚持“隐私优先”原则,所有数据默认本地存储,从根本上保障用户信息安全。

MineContext:火山引擎推出的开源主动式上下文感知 AI 助手

二、功能特色

MineContext的功能围绕“上下文的全生命周期管理”展开,涵盖从信息收集到智能应用的完整流程,核心特色可概括为五大方面:

1. 轻松收集:多源多模态信息“无感知”入库

MineContext支持对分散在不同场景的上下文信息进行“低负担”收集,无需用户手动复制粘贴或格式转换,具体包括:

  • 多数据源兼容:可自动捕获文档(PDF、Word、Markdown等)、屏幕截图(支持定时截图或手动触发)、网页内容(浏览器插件联动)、音视频(本地文件或实时录制片段)、聊天记录(支持微信、Teams等主流工具导出文件)等;

  • 智能格式处理:对非结构化数据(如手写笔记照片、语音转文字)进行自动识别与结构化转换,例如将截图中的文字提取为可编辑文本,将语音内容转为带时间戳的文字记录;

  • 轻量化管理:用户可通过“标签分类”“优先级标注”对收集的信息进行初步整理,系统会自动生成信息缩略图与摘要,避免用户陷入“整理即负担”的困境。

2. 主动交付:关键信息“找上门”

不同于传统工具“需用户主动搜索”的被动模式,MineContext能基于用户行为与时间维度,主动推送高价值信息,具体表现为:

  • 周期性总结:每日/每周自动生成“上下文简报”,汇总期间收集的关键事件(如会议要点)、待办事项(从聊天记录或文档中提取)、知识碎片(如专业术语解释);

  • 场景化提醒:当用户打开特定应用(如Word、PPT)时,自动推送与当前任务相关的历史上下文(例如写报告时推送之前收集的同类报告框架);

  • 状态同步:若用户在多个设备登录(需手动开启跨设备同步,数据仍本地存储),系统会将某一设备的关键操作(如新增标签、标记重要信息)同步至其他设备的首页。

3. 智能重现:创作时“按需唤醒”相关上下文

在写作、策划、研究等创作场景中,MineContext能通过语义理解与相似性匹配,精准呈现相关信息,避免“想不起来”或“找半天”的问题:

  • 实时联想:当用户输入文字(如在编辑器中写论文)时,系统会实时分析内容主题,从历史上下文中提取相关文献引用、数据案例、观点素材,以侧边栏形式展示;

  • 多模态关联:支持跨类型信息联想,例如用户查看一张产品设计图时,系统会同步展示相关的设计说明文档、讨论记录中的修改建议,甚至是同类产品的截图对比;

  • 无干扰呈现:所有推荐内容默认折叠,用户可通过点击展开详情,避免信息过载影响创作节奏。

4. 隐私优先:数据安全“自己掌控”

隐私保护是MineContext的核心设计原则,具体措施包括:

  • 本地存储默认:所有收集的上下文数据(文本、图像、音视频)默认存储在用户设备本地(支持自定义存储路径),不强制上传云端;

  • 端到端加密:若用户开启跨设备同步功能,数据传输过程采用端到端加密,仅用户可解密查看;

  • 权限可控:用户可随时查看“数据访问日志”(记录哪些功能访问了哪些信息),并支持一键删除单条数据或批量清理历史记录。

5. 上下文工程架构:支持多模态数据全生命周期管理

MineContext的底层架构围绕“上下文工程”设计,可实现从数据捕获、处理、存储到消费的完整流程,并能生成六种“智能上下文”,满足不同场景需求:

智能上下文类型 定义 典型应用场景
实体上下文 从信息中提取的关键实体(人物、机构、术语等)及关系 论文写作时自动生成“术语对照表”
时序上下文 按时间排序的事件序列(如会议记录、项目进度) 项目复盘时生成“时间线回顾”
关联上下文 语义或场景相关的信息集合(如同一主题的文档与截图) 创作时的“素材联想库”
任务上下文 从信息中提取的待办事项、截止日期等 日常办公的“智能待办清单”
摘要上下文 长文本的精简总结(如文章摘要、视频关键帧) 快速浏览文献或会议记录
多模态融合上下文 整合文本、图像、音频的复合信息(如带截图的会议纪要) 产品方案汇报时的“多媒体素材包”

三、技术细节

MineContext采用模块化、分层架构设计,各组件职责明确,可灵活扩展,核心技术架构与实现细节如下:

1. 整体架构

项目代码结构清晰,主要分为8大核心模块,各模块通过标准化接口通信,便于开发者二次开发或替换组件:

模块名称 核心功能 技术栈/工具依赖
server/ 提供API服务、WebSocket实时通信、静态资源管理 FastAPI(后端框架)、Uvicorn(服务器)
managers/ 协调各模块工作的业务逻辑层(如任务调度、事件响应) 自定义状态机、异步任务队列(Celery)
context_capture/ 上下文信息捕获模块 截图工具(mss)、OCR(Tesseract)、语音转文字(Whisper)
context_processing/ 上下文处理流水线(清洗、分块、特征提取) 文本分块(LangChain)、实体识别(spaCy)、向量生成(Sentence-BERT)
context_consumption/ 上下文消费与生成(如总结、推荐) 大语言模型接口(OpenAI、豆包等)、视觉语言模型(VLM)
storage/ 数据存储层(支持多后端) SQLite(轻量本地数据库)、ChromaDB(向量数据库)、文件系统(原始文件存储)
llm/ 大语言模型集成层 统一API适配层(支持切换不同LLM提供商)
ui/ 用户界面(桌面端) Electron(跨平台桌面应用框架)、React(前端界面)

2. 关键技术流程

以“用户收集一篇PDF文档并在写作时调用相关信息”为例,核心技术流程如下:

  1. 捕获阶段:context_capture模块通过文件监控或用户手动上传获取PDF,调用OCR工具提取文本(若PDF为扫描件);

  2. 处理阶段:context_processing模块将文本分块(按章节或语义段落),通过llm模块调用嵌入模型生成向量,同时提取实体(如作者、关键词)和待办事项(如文档中的“需完成XX”);

  3. 存储阶段:storage模块将原始PDF、分块文本、向量数据分别存储至文件系统、SQLite、ChromaDB,并建立关联索引;

  4. 消费阶段:当用户在ui端写作时,context_consumption模块通过WebSocket实时接收用户输入,调用llm模块分析语义,再通过storage模块的向量数据库检索相似分块,最终以关联上下文形式推送到界面。

3. 扩展性设计

MineContext支持多维度扩展,满足不同用户需求:

  • 数据源扩展:context_capture模块提供标准化接口,开发者可通过编写插件支持新数据源(如Notion、Obsidian的API对接);

  • 存储后端扩展:storage模块支持自定义存储适配器,可替换为PostgreSQL(多用户场景)、Milvus(大规模向量存储)等;

  • 模型扩展:llm模块支持接入本地大模型(如Llama 3),只需实现统一的模型调用接口即可替换默认模型。

MineContext:火山引擎推出的开源主动式上下文感知 AI 助手

四、应用场景

MineContext的功能特性使其适用于多种需要管理信息、辅助创作的场景,以下为典型应用案例:

1. 学术研究与论文写作

  • 场景痛点:研究员需处理大量文献(PDF、会议记录),写作时难以及时调用相关理论或数据;

  • MineContext应用

  • 收集阶段:自动捕获下载的文献PDF,提取标题、摘要、关键词并生成实体上下文(如“作者A的研究方向”“术语B的定义”);

  • 处理阶段:对文献按“研究方法”“结论”等标签分类,生成关联上下文(如“同一主题的5篇对比文献”);

  • 创作阶段:写论文时,智能重现模块实时推送相关文献的引用片段、数据图表(多模态融合上下文),避免反复切换窗口查找。

2. 学生学习与复习

  • 场景痛点:课堂笔记(手写、截图、录音)分散,复习时难以系统整合知识点;

  • MineContext应用

  • 收集阶段:通过手机拍照上传手写笔记(OCR转为文本),同步课堂录音(转文字并关联时间戳);

  • 主动交付:每周生成“学习简报”(摘要上下文),汇总当周重点知识点、未理解的术语(需标注);

  • 复习阶段:查看某一知识点时,智能重现相关的课堂截图、老师讲解录音片段(多模态融合上下文),强化记忆。

3. 职场办公与项目管理

  • 场景痛点:会议记录、邮件往来、聊天中的待办事项易遗漏,项目复盘时难梳理时间线;

  • MineContext应用

  • 收集阶段:自动捕获会议录音(转文字)、聊天记录中的“任务分配”内容,提取待办事项(任务上下文);

  • 主动交付:每日推送“待办清单”,标注截止日期(从邮件或聊天记录中提取),同步关联的会议纪要片段;

  • 项目复盘:生成时序上下文(按时间排序的项目关键事件),关联各阶段的文档、截图,快速梳理进度与问题。

4. 内容创作(自媒体、设计师)

  • 场景痛点:素材(文案、图片、灵感片段)杂乱,创作时难快速组合;

  • MineContext应用

  • 收集阶段:保存网页灵感截图、随手写的文案草稿、音乐片段(作为氛围素材);

  • 处理阶段:对素材按“风格”“主题”分类,生成多模态融合上下文(如“治愈系文案+对应风格图片”);

  • 创作阶段:写脚本时,智能重现相关文案素材;设计配图时,推送关联的图片灵感与用户标注的“修改建议”(来自历史聊天记录)。

MineContext:火山引擎推出的开源主动式上下文感知 AI 助手

五、使用方法

MineContext支持Windows、macOS系统,使用流程分为“安装初始化”“基础操作”“高级设置”三部分,具体步骤如下:

1. 安装与初始化

操作步骤 Windows系统 macOS系统
下载应用 访问GitHub Releases页,选择对应Windows版本(.exe文件) 下载macOS版本(.dmg文件),拖拽至应用程序文件夹
权限设置 双击安装,按提示授予文件访问权限 终端执行命令:sudo xattr -d com.apple.quarantine "/Applications/MineContext.app"(解除隔离)
初始化配置 首次打开应用,进入“设置-API配置”,填写LLM API密钥(支持OpenAI、豆包等,本地模型可跳过) 同Windows步骤,额外在“隐私与安全性”中允许应用访问文件和屏幕录制

2. 基础操作

  • 收集上下文

  • 手动添加:点击首页“+”按钮,上传文件(文档、图片、音视频)或输入文本;

  • 自动捕获:在“设置-捕获设置”中开启“屏幕定时截图”(每10分钟/自定义间隔)、“文档监控”(指定文件夹,新增文件自动导入);

  • 查看主动推送:首页“今日简报”板块展示每日总结与待办事项,点击条目可查看完整上下文;

  • 智能重现辅助创作:打开内置编辑器(或关联外部编辑器,如Word),输入内容时,右侧“相关上下文”栏会自动更新推荐信息,点击可插入当前文档。

3. 高级设置

  • 存储管理:在“设置-存储”中修改本地存储路径,或切换向量数据库(默认ChromaDB,可改为SQLite向量存储);

  • 模型切换:在“设置-LLM”中选择默认模型(如切换为豆包API),或配置本地模型路径(需提前下载并部署);

  • 标签与筛选:通过首页“标签云”快速筛选同类上下文,支持自定义标签(如“论文素材”“会议记录”)。

六、常见问题解答(FAQ)

MineContext的数据存储在哪里?是否会上传云端?

所有数据默认存储在用户设备本地(路径可在“设置-存储”中查看),除非用户手动开启“跨设备同步”,否则不会上传云端。跨设备同步时,数据采用端到端加密传输,仅用户可解密。

支持哪些文件格式?能否识别手写体或方言语音?

支持文档(PDF、Word、Markdown等)、图像(JPG、PNG等)、音视频(MP3、MP4等);手写体识别依赖OCR工具(默认Tesseract,可替换为更高精度的模型),方言语音需在“设置-语音处理”中选择对应方言模型(如粤语、四川话)。

使用MineContext需要付费吗?LLM调用是否收费?

MineContext本身是开源免费软件,无使用费用;但调用第三方LLM(如OpenAI、豆包)时,需用户自行承担API调用费用(具体收费标准见对应服务商官网),也可使用免费开源本地模型(如Llama 3)。

能否与Notion、Obsidian等工具联动?

目前支持通过“导入文件”方式将Notion、Obsidian的导出文件(如Markdown)导入MineContext;开发者可通过编写插件实现API级联动(详见GitHub贡献指南)。

卸载应用后,数据会保留吗?如何备份数据?

卸载时默认保留本地数据(存储路径下的文件);备份可通过“设置-存储-导出数据”功能,将所有上下文打包为zip文件,重装后通过“导入数据”恢复。

对设备配置有要求吗?低配置电脑能否流畅运行?

基础功能(文件管理、手动标签)对配置要求低(4GB内存即可);若开启实时OCR、向量检索等功能,建议内存≥8GB,处理器为i5及以上(或同级别AMD处理器)。

七、相关链接

八、总结

MineContext是一款由火山引擎开源的主动式上下文感知AI助手,通过多模态数据收集、智能处理、主动推送与隐私优先的设计,解决了用户在信息管理与创作中的痛点。其模块化架构支持灵活扩展,适用于学术研究、学习复习、职场办公、内容创作等多种场景,既满足普通用户对信息整合的需求,也为开发者提供了二次开发的基础。作为一款本地优先的开源工具,MineContext在效率与隐私之间实现了平衡,是信息时代个人知识管理与创作辅助的实用选择。

打赏
THE END
作者头像
AI工具箱
一个喜欢收集AI工具的小萌新