返回 MCP 目录
public公开dns本地运行

auto-snap-mcp

Auto-Snap MCP是一个自动化截图和文档处理工具,可将截图自动转换为PDF,支持通过自然语言命令操作,适用于多种系统环境。

article

README

🚀 自动截图MCP 📸

自动截图MCP是一款专门为MCP客户端打造的工具,它可以自动进行截图捕获和文档处理。借助简单的自然语言指令,MCP客户端就能实现窗口捕获、文档处理,并轻松创建PDF文件。

🚀 快速开始

我该选择哪种安装方式?

  • 🐳 Docker → 无需设置,随处可用(推荐)
  • 🪟 WSL2 → 适用于已安装WSL2的Windows用户
  • 🐧 Linux → 适用于原生Linux系统

安装步骤

1. 获取Auto - Snap:

git clone https://github.com/your-repo/auto-snap-mcp
cd auto-snap-mcp

2. 安装依赖(仅适用于Linux):

# 如果使用Docker,请跳过此步骤
sudo apt install -y wmctrl xdotool tesseract-ocr
uv sync

3. 配置Claude Desktop:

编辑 ~/.claude/claude_desktop_config.json 并添加以下其中一个配置:

🐳 Docker(推荐 - 无需设置!)

{
  "mcpServers": {
    "auto-snap-mcp": {
      "command": "docker",
      "args": [
        "run", "-i", "--rm",
        "-e", "DISPLAY=:0", 
        "-v", "/tmp/.X11-unix:/tmp/.X11-unix:rw",
        "-v", "${HOME}/auto-snap-captures:/app/captures:rw",
        "mcp/auto-snap-mcp:latest"
      ]
    }
  }
}

🪟 WSL2(适用于安装了WSL2的Windows系统)

{
  "mcpServers": {
    "auto-snap-mcp": {
      "command": "wsl.exe",
      "args": [
        "bash", "-c",
        "cd /home/YOUR_WSL_USERNAME/auto-snap-mcp && DISPLAY=:0 /home/YOUR_WSL_USERNAME/.local/bin/uv run python server.py"
      ]
    }
  }
}

🐧 原生Linux

{
  "mcpServers": {
    "auto-snap-mcp": {
      "command": "uv",
      "args": ["run", "python", "server.py"],
      "cwd": "/home/YOUR_USERNAME/auto-snap-mcp",
      "env": {"DISPLAY": ":0"}
    }
  }
}

4. 重启Claude Desktop并验证是否正常工作:

  • "列出我所有打开的窗口" ← 以此命令开始测试连接
  • "捕获此PDF并转换为图像"
  • "截取5张截图并将它们制作成PDF"

✅ 是否正常工作? 如果能看到列出的窗口,则表示正常。若不能,请查看下面的🚨 无法正常工作?部分。

📁 文件保存位置

默认情况下,所有捕获的文件将保存到:

~/auto-snap-captures/

完整路径示例:

  • Linux: /home/username/auto-snap-captures/
  • WSL2: /home/username/auto-snap-captures/
  • Windows (Docker): C:\Users\username\auto-snap-captures\

✨ 主要特性

📋 文档捕获

  • 可对任意窗口或整个屏幕进行截图
  • 能自动捕获多页文档
  • 支持PDF、演示文稿、网页等多种文档类型

🔍 图像处理

  • 从截图中提取文本(OCR)
  • 自动提升图像质量
  • 可同时处理多张图像

📄 PDF创建

  • 即时将截图转换为PDF
  • 通过智能命名对文件进行整理
  • 压缩PDF以减小文件大小

🎯 可尝试的命令

"将此文档捕获为PDF" → 截取屏幕并创建PDF "从这些图像中提取文本" → 对截图执行OCR操作 "存档此演示文稿" → 将所有幻灯片截图保存为一个PDF "列出我所有打开的窗口" → 查看可捕获的内容 "截取5张截图并将它们制作成PDF" → 多页捕获

💡 专业提示:

  • 表述具体"捕获Chrome窗口""截取屏幕截图" 更有效
  • 多步骤操作"对这个演示文稿进行截图并提取所有文本"
  • 批量处理"处理我下载文件夹中的所有图像并制作成PDF"

如果想更改文件保存位置,请查看下面的🎨 自定义捕获设置部分。

🛠️ 系统支持

  • Linux(原生X11)
  • WSL2(从Linux运行Windows应用)
  • ⚠️ macOS(搭配XQuartz - 实验性支持)

🚨 无法正常工作?

常见修复方法:

# 检查依赖项
uv run python -c "from capture import check_dependencies; print(check_dependencies())"

# 修复X11显示问题
export DISPLAY=:0

# 测试服务器
uv run python server.py

仍然遇到问题?

  1. 确保配置路径正确:~/.claude/claude_desktop_config.json
  2. 更改配置后重启Claude Desktop
  3. 检查Claude Desktop日志中的错误信息

🎨 自定义捕获设置

设置文件保存位置:

export AUTO_SNAP_OUTPUT_DIR="$HOME/Documents/Screenshots"

按日期组织文件:

export AUTO_SNAP_USE_DATE_SUBDIRS=true
export AUTO_SNAP_INCLUDE_TIMESTAMP=true

自定义文件名:

export AUTO_SNAP_FILE_NAME_TEMPLATE="doc_{page:04d}"

🌍 多语言支持

添加更多OCR语言:

sudo apt install tesseract-ocr-spa  # 西班牙语
sudo apt install tesseract-ocr-fra  # 法语
sudo apt install tesseract-ocr-deu  # 德语

然后告诉Claude:"以西班牙语处理此文档"

🔐 隐私保护

  • 所有操作均在本地机器上运行
  • 不使用云服务或进行上传操作
  • 仅捕获你要求的内容
  • 自动清理临时文件

准备好实现截图自动化了吗? 安装Auto - Snap,开始与你的MCP客户端交流文档处理任务吧!🚀

help

运行方式说明

cloud

托管运行

托管运行通常表示这个 MCP Server 由服务方环境承载,用户一般按页面提供的连接方式或授权流程接入,不需要在本地长期启动一个 MCP 进程

  1. 打开服务方连接页
  2. 完成授权或复制端点
  3. 在 MCP 客户端中连接
terminal

本地运行 / 其它方式

本地运行通常需要用户在自己的电脑或服务器上安装依赖,把 server_config 复制到 MCP 客户端,并按 env_schema 补齐环境变量、密钥或其它配置

  1. 复制 server_config
  2. 安装所需依赖
  3. 补齐环境变量后重启客户端