README
🚀 未结构化内容
本项目聚焦于无结构化数据处理,借助 Anthropic 的 MCP 服务器,可实现无结构化数据的有效处理,并能集成到 Claude 桌面环境,便于开发与调试。
🚀 快速开始
本项目主要围绕无结构化数据处理展开,利用 Anthropic 的 MCP 服务器,可完成无结构化数据处理系统的搭建,并集成到 Claude 桌面环境进行开发调试。
✨ 主要特性
无结构化内容概述
简介
- 无结构化数据:指没有固定格式的数据,像文本、图像和视频等都属于此类。
- 数字时代现状:当今数字时代,超 90%的数据为无结构化数据,涵盖电子邮件、文档、社交媒体帖子等。
特点
- 灵活性高:无结构化数据能以任意形式存在,存储和传输都很便捷。
- 难以处理:因缺乏固定格式,难以直接用于数据分析和机器学习模型。
处理方法
- 数据提取:运用自然语言处理(NLP)技术从文本中提取有用信息。
- 数据标注:为无结构化数据添加标签或元数据,方便管理。
- 数据转换:将无结构化数据转换为结构化格式,以便进一步分析。
应用场景
- 文本挖掘:从大量文档中提取有用信息。
- 情感分析:分析社交媒体帖子中的情感倾向。
- 图像识别:识别图像中的物体或场景。
📦 安装指南
安装依赖项
pip install uvicorn python-dotenv
运行 MCP 服务器
uv run python uns_mcp/server.py --host 0.0.0.0 --port 8080
配置文件
创建 config.json 文件:
{
"mcpServers": {
"UNS_MCP": {
"command": "ABSOLUTE/PATH/TO/.local/bin/uv",
"args": [
"--directory",
"ABSOLUTE/PATH/TO/YOUR-UNS-MCP-REPO/uns_mcp",
"run",
"server.py"
],
"env": [
"UNSTRUCTURED_API_KEY": "<your key>"
]
}
}
}
集成到 Claude 桌面
编辑 claude_desktop_config.json 文件
# 对于 macOS 或 Linux:
code ~/Library/Application\ Support/Claude/claude_desktop_config.json
# 对于 Windows:
code $env:AppData\Claude\claude_desktop_config.json
添加 MCP 服务器配置
{
"mcpServers": {
"UNS_MCP": {
"command": "ABSOLUTE/PATH/TO/.local/bin/uv",
"args": [
"--directory",
"ABSOLUTE/PATH/TO/YOUR-UNS-MCP-REPO/uns_mcp",
"run",
"server.py"
],
"env": [
"UNSTRUCTURED_API_KEY": "<your key>"
]
}
}
}
重启 Claude 桌面
完成上述配置后,重启 Claude 桌面使配置生效。
调试工具
使用 MCP Inspector 工具调试/测试 MCP 服务器
mcp dev uns_mcp/server.py
设置环境变量以记录请求参数
DEBUG_API_REQUESTS=false
💻 使用示例
基础用法
服务器端运行
# 在一个终端中运行服务器:
uv run python uns_mcp/server.py --host 127.0.0.1 --port 8080
# 或者
make sse-server
客户端端运行
# 在另一个终端中运行客户端:
uv run python minimal_client/client.py "http://127.0.0.1:8080/sse"
# 或者
make sse-client
高级用法
在实际开发和调试过程中,可根据需求调整服务器和客户端的配置参数,以满足不同场景的需求。
⚠️ 重要提示
首先使用
ctrl+c退出客户端,然后关闭服务器。否则,服务器可能会挂起。
Scan to contact