金大哥 - mcp-server-webscan MCP 详情

article

README

🚀 MCP 网页扫描服务器

MCP 网页扫描服务器是一个基于 Model Context Protocol (MCP) 的服务器，主要用于网页内容的抓取、分析和信息提取。它提供了一系列实用工具，能有效获取、分析并提取网页中的关键信息。

🚀 快速开始

MCP 网页扫描服务器为网页信息处理提供了便捷的解决方案，你可以按照以下步骤进行安装和使用。

✨ 主要特性

页面抓取：能够将网页转换为 Markdown 格式，极大地方便了后续的分析工作。
链接提取：可以从网页中精准提取并深入分析链接。
网站爬取：支持递归爬取网站内容，有助于全面发现信息。
错误处理：具备全面的错误处理机制，可处理无效参数、网络错误、内容解析错误、URL 验证等多种问题。

📦 安装指南

使用 Smithery 安装

# 使用Smithery进行安装的命令

构建

npm run build

💻 使用示例

开发模式

npm run dev

服务器启动

node index.ts

基础用法

安装说明

使用 Smithery 安装

# 使用Smithery进行安装的命令

手动安装

克隆仓库：git clone <repository-url>
进入目录：cd mcp-webscan-server
安装依赖：npm install

高级用法

工具列表

fetch-page：
- 用途：将网页转换为 Markdown 格式。
- 参数：URL（必填）。
- 返回值：提取的 Markdown 内容。
extract-links：
- 用途：从网页中提取所有链接。
- 参数：URL（必填）。
- 返回值：提取的所有链接列表。
crawl-site：
- 用途：递归爬取网站内容。
- 参数：起始 URL（必填）、深度限制（可选）。
- 返回值：爬取到的所有网页链接列表。

🔧 技术细节

项目结构图

├── src/
│   ├── initialize.ts
│   └── index.ts    # 主服务器入口文件
├── build/          # 编译后的 JavaScript（已更正）
├── node_modules/
├── .clinerules
├── .gitignore
├── Dockerfile
├── LICENSE
├── mcp-consistant-servers-guide.md
├── package.json
├── package-lock.json
├── README.md
├── RFC-2025-001-Refactor.md
├── smithery.yaml
└── tsconfig.json

🤝 贡献指南

步骤

Fork 仓库
创建功能分支（例如：git checkout -b feature/amazing-feature）
提交更改（例如：git commit -m 'Add some amazing feature'）
推送到分支（例如：git push origin feature/amazing-feature）
提交 Pull Request

代码规范

遵循项目现有的编码风格。
确保新增功能通过现有测试用例。
提供详细的提交说明。

📄 许可证

本项目采用 MIT 许可证，详情请参阅 LICENSE 文件。

mcp-server-webscan

README

🚀 MCP 网页扫描服务器

🚀 快速开始

✨ 主要特性

📦 安装指南

使用 Smithery 安装

构建

💻 使用示例

开发模式

服务器启动

基础用法

安装说明

使用 Smithery 安装

手动安装

高级用法

工具列表

🔧 技术细节

项目结构图

🤝 贡献指南

步骤

代码规范

📄 许可证

运行方式说明

托管运行

本地运行 / 其它方式