README
🚀 MCP NPX 抓取
这是一个强大的MCP服务器,可轻松抓取网络内容,并将其转换为HTML、JSON、Markdown、纯文本等多种格式,为内容处理提供便利。
🚀 快速开始
本项目提供了便捷的安装和使用方式,以下是快速上手的步骤:
安装
全局安装
npm install -g @tokenizin/mcp-npx-fetch
直接使用
npx mcp-npx-fetch
使用
CLI 使用
直接在终端运行以下命令获取帮助:
mcp-npx-fetch --help
Claude Desktop 集成
- 打开
settings.json文件。 - 添加以下配置:
{
"mcp-npx_FETCH": {
"path": "node_modules/@tokenizin/mcp-npx-fetch/dist/index.js",
"args": []
}
}
- 在项目中使用插件。
✨ 主要特性
- 🌐 通用内容抓取:支持 HTML、JSON、纯文本和 Markdown 格式,满足多样化的内容需求。
- 🔒 自定义头支持:可添加身份验证和自定义请求头,增强数据获取的安全性和灵活性。
- 🛠 内置转换工具:提供 HTML 到 Markdown 的转换功能,方便内容格式的转换。
- 💡 类型安全:使用 TypeScript 和 Zod 实现严格的类型检查,确保代码的健壮性。
- 📈 高效处理:支持大文件的快速解析和处理,提高工作效率。
📦 安装指南
全局安装
npm install -g @tokenizin/mcp-npx-fetch
直接使用
npx mcp-npx-fetch
💻 使用示例
基础用法
mcp-npx-fetch --input "https://example.com" --output "./result.md"
高级用法
mcp-npx-html-to-md --input "./index.html" --output "./document.md"
📚 详细文档
可用工具
1. mcp-npx-fetch
参数说明
| 参数名 | 类型 | 描述 |
|--------|------|------|
| input | string | 需要处理的输入路径或内容 |
| output | string | 输出结果的保存路径 |
示例用法
mcp-npx-fetch --input "https://example.com" --output "./result.md"
2. html-to-md
功能描述
将 HTML 内容转换为 Markdown 格式。
使用示例
mcp-npx-html-to-md --input "./index.html" --output "./document.md"
🔧 技术细节
本项目采用了以下技术栈:
- JSDOM:用于解析和操作 HTML 文档。
- Turndown:提供 HTML 转 Markdown 功能。
- TypeScript:实现类型安全的代码结构。
- Zod:用于严格的类型验证和数据处理。
🤝 贡献
欢迎贡献!请随意提交 Pull Request。对于重大更改,请先打开问题讨论您想更改的内容。
- 复刻仓库。
- 创建功能分支 (
git checkout -b feature/AmazingFeature)。 - 提交更改 (
git commit -m '添加一些 AmazingFeature')。 - 推送到分支 (
git push origin feature/AmazingFeature)。 - 打开 Pull Request。
📄 许可证
此项目在 MIT 许可证下发布,详细信息请参阅 LICENSE 文件。
Scan to contact