Windows-MCP开源工具安装与使用全指南:让AI轻松操控Windows系统

原创 发布日期:
3

在AI与操作系统交互日益紧密的当下,一款能让AI大模型直接操控Windows系统的工具备受关注。Windows-MCP(Windows Model Context Protocol) 便是这样一款开源工具,它可实现AI大模型与Windows系统的直接交互,将自然语言指令转化为实际的系统操作,无论是启动应用、调整窗口还是文本输入,都能高效完成,大幅提升工作与操作效率。目前该工具处于持续更新状态,后续将带来更多实用功能。本文将详细拆解其安装与使用流程,助力大家快速上手。

一、安装前准备:筑牢使用基础

在安装Windows-MCP前,需确保系统环境与工具要求匹配,同时备好必要的辅助工具,避免后续操作出现异常。

1.1 核心环境要求(必满足)

这几项要求是工具正常运行的前提,缺一不可,需提前核查:

要求类型 具体规格说明
操作系统 支持Windows 7、8、10、11,32位或64位系统均兼容
Python环境 必须安装Python 3.13及以上版本,低于此版本会直接导致服务启动失败
包管理器 推荐安装UV包管理器(运行速度优于传统pip),安装命令:pip install uv

1.2 额外工具(按需安装)

根据搭配使用的AI工具不同,需准备对应的辅助工具:

  • 若搭配Claude桌面版使用(推荐场景),需安装DXT工具,安装命令:npm install -g @anthropic-ai/dxt

  • 若搭配Gemini CLI使用,无需额外安装上述DXT工具

二、源码获取:两种方式任选

Windows-MCP为开源工具,需先获取其源码才能进行后续安装操作,提供两种获取方式,可根据自身情况选择:

2.1 方式一:Git克隆(已安装Git工具)

若电脑已安装Git,通过命令行克隆源码更便捷,步骤如下:

  1. 打开Windows系统的命令提示符(CMD)或PowerShell;

  2. 输入克隆命令并执行:git clone https://github.com/CursorTouch/Windows-MCP.git

  3. 进入项目目录:输入cd Windows-MCP并执行,完成后便处于工具的核心目录中。

2.2 方式二:下载ZIP压缩包(未安装Git)

未安装Git的用户可直接下载源码压缩包,步骤如下:

  1. 访问Windows-MCP的GitHub仓库(链接:https://github.com/CursorTouch/Windows-MCP);

  2. 点击页面中的“Code”按钮,在下拉菜单中选择“Download ZIP”;

  3. 将下载的ZIP压缩包解压到本地任意文件夹,解压后即可获得完整源码。

三、分场景安装:适配不同AI工具

Windows-MCP需搭配AI工具使用,针对主流的Claude桌面版和Gemini CLI,分别提供了对应的安装流程,可根据使用的AI工具选择对应场景操作。

3.1 场景一:搭配Claude桌面版(推荐)

Claude桌面版搭配Windows-MCP的操作体验更优,安装步骤如下:

  1. 生成扩展文件:在Windows-MCP项目目录中,执行命令npx @anthropic-ai/dxt pack,执行完成后会在项目目录中生成一个.dxt格式的扩展文件;

  2. 进入Claude扩展设置:打开Claude桌面版,点击右上角的设置图标(齿轮形状)

  3. 安装扩展:在设置菜单中找到并选择“扩展”选项,然后点击“安装扩展”按钮;

  4. 完成安装:在弹出的文件选择窗口中,找到并选择步骤1生成的.dxt文件,确认后Claude会提示扩展安装成功并自动启用。

3.2 场景二:搭配Gemini CLI

Gemini CLI需通过配置文件关联Windows-MCP,步骤如下:

  1. 找到配置文件路径:Gemini的默认配置文件路径为%USERPROFILE%/.gemini/settings.json,可直接复制路径在文件资源管理器中打开;

  2. 编辑配置文件:用记事本或其他文本编辑器打开settings.json,在文件中添加以下配置(需将C:/你的路径/Windows-MCP替换为实际的源码解压路径):

    "mcpServers": { 
     "windows-mcp": {  
      "command": "uv",  
      "args": [   
       "--directory",   
       "C:/你的路径/Windows-MCP",   
       "run",   
       "main.py"  
      ] 
     }
    }
  3. 重启生效:保存配置文件后,重启Gemini CLI,此时两者已成功关联。

Windows-MCP开源工具安装与使用全指南:让AI轻松操控Windows系统

四、基本使用:三步实现AI操控系统

完成安装后,只需简单三步即可通过AI指令操控Windows系统,流程清晰易操作。

4.1 第一步:启动服务(核心步骤)

在Windows-MCP项目目录中,执行启动命令:uv run main.py。启动成功的标识为:命令行窗口中显示两行关键信息——Windows-MCP server started on port 5000Waiting for connections...,表示服务已在5000端口运行。

4.2 第二步:发送自然语言指令

启动服务后,直接向已关联的AI工具(Claude或Gemini)发送自然语言指令即可,AI会通过Windows-MCP将指令转化为系统操作。以下为常见指令示例:

  • 应用启动类:“打开记事本,输入‘Windows-MCP测试’”“启动Microsoft Edge浏览器并访问百度”;

  • 窗口操作类:“将当前记事本窗口移动到屏幕右侧”“最大化Chrome浏览器窗口”;

  • 系统功能类:“打开计算器并计算128乘以4”“截取当前屏幕并保存到桌面,命名为‘测试截图’”;

  • 命令执行类:“通过PowerShell查看C盘根目录下的文件列表”。

4.3 第三步:结束服务

使用完毕后,在启动服务的命令行窗口中,按Ctrl+C组合键即可关闭服务,避免不必要的资源占用。

五、高级配置:自定义工具参数

若需根据自身使用场景调整工具参数,可通过修改配置文件实现。Windows-MCP的配置文件为项目目录中的config.json,用文本编辑器打开即可修改,常见可配置项如下:

  • 端口修改:默认端口为5000,若出现端口冲突,可修改“port”字段值;

  • 超时设置:调整“timeout”字段,设置指令执行的最长等待时间,避免长时间无响应;

  • 日志级别:通过“log_level”字段设置日志详细程度,可选“info”“debug”等,便于问题排查;

  • 识别精度:修改“ui_recognition_accuracy”字段,优化窗口、按钮等UI元素的识别准确性;

  • 快捷键设置:在“shortcut_keys”字段中添加自定义快捷键,如设置“Ctrl+Alt+M”快速启动服务。

六、常见问题解决:高效排查异常

使用过程中若遇到问题,可参考以下常见问题及解决方案,快速恢复工具正常使用:

问题现象 解决方案
服务启动失败 1. 核查Python版本是否为3.13及以上;2. 进入项目目录执行uv install重新安装依赖
AI无法执行指令 1. 确认服务是否正常运行(查看命令行是否有等待连接的提示);2. 检查防火墙设置,确保5000端口未被拦截
中文应用识别不准确 1. 指令中使用应用英文名称(如“打开WeChat”替代“打开微信”);2. 在config.json中添加名称映射,关联中文名称与应用exe路径
操作延迟过高 1. 关闭后台冗余程序,减少CPU和内存占用;2. 降低屏幕分辨率或减少同时运行的应用数量

七、安全注意事项:规避使用风险

由于Windows-MCP具备直接操控系统的权限,使用时需格外注意安全问题,规避潜在风险:

  • 环境安全:请勿在公共电脑、陌生设备或不安全的网络环境中使用,防止系统被非法操控;

  • 权限控制:避免向AI工具授予管理员权限,防止误操作或恶意指令对系统造成损坏;

  • 及时关闭服务:使用完毕后务必通过Ctrl+C关闭服务,尤其在处理敏感信息的场景下,避免服务持续运行带来风险;

  • 版本更新:定期访问GitHub仓库查看更新,及时更新工具至最新版本,修复已知安全漏洞。

通过以上步骤,即可完成Windows-MCP的安装与配置,实现AI大模型对Windows系统的便捷操控。随着工具的持续更新,后续还将支持更多功能,大家可关注项目仓库获取最新动态。

打赏
THE END
作者头像
AI铺子
关注ai行业发展,专注ai工具推荐