MeetGrow AI PC Agent Skill
Overview
会展招商办公提效工具。支持名片 OCR 识别、会议纪要生成、语音转写、语音播报等功能。基于 Intel AI PC 本地运行。
Model: Qwen3.6-35B-A3B
Framework: OpenVINO
Hardware: Intel Core Ultra 5 125H (CPU + Arc GPU + NPU)
License: MIT
Author: WinClaw
Tools
1. ocr_business_card
功能: 识别名片图片,提取姓名、公司、职位、电话、邮箱等信息。
输入: 图片文件路径
输出: 结构化联系人 JSON
支持: 中英文名片、横版/竖版/方形名片
Example:
{"image_path": "/path/to/card.jpg"}
Output:
{
"status": "success",
"contacts": [
{
"name": "张三",
"company": "XX科技有限公司",
"title": "采购总监",
"phone": "138-0000-0000",
"email": "zhangsan@example.com"
}
]
}
2. ocr_document
功能: 识别文档/票据图片中的文字内容。
输入: 图片文件路径
输出: 识别出的文本
支持: 中文、英文、中英混合、表格、票据
Example:
{"image_path": "/path/to/doc.jpg", "task": "general"}
Output:
{
"status": "success",
"text": "识别出的文档文本..."
}
Task Types:
general: 通用文本table: 表格receipt: 票据
3. speech_to_text
功能: 将语音/会议录音文件转换为文字。
输入: 音频文件路径 (wav/mp3/m4a)
输出: 带时间戳的转写文本
支持: 中文、中英混合、说话人分离
Example:
{"audio_path": "/path/to/meeting.wav", "diarization": True}
Output:
{
"status": "success",
"transcript": [
{"speaker": "speaker_0", "start": 0.0, "end": 5.2, "text": "大家好,现在开始..."},
{"speaker": "speaker_1", "start": 5.5, "end": 10.1, "text": "我先汇报一下..."}
]
}
4. text_to_speech
功能: 将文本转换为语音播报。
输入: 文本字符串
输出: 音频文件路径
支持: 中文女声 (小晓)、男声 (云扬)
Example:
{"text": "今天的会议有 3 项议程...", "voice": "小晓"}
Output:
{
"status": "success",
"audio_path": "/path/to/output.mp3"
}
Voice Options:
小晓: 默认女声云扬: 男声晓晓: 活泼女声
5. generate_meeting_minutes
功能: 基于转写文本生成会议纪要。
输入: 转写文本 + 会议基本信息
输出: 结构化会议纪要 (议程、摘要、决策、待办)
由 Agent 内部调用,自动整合 OCR + ASR + 摘要能力
Example:
{
"transcript": "会议完整转写文本...",
"meeting_title": "Q2 招商推进会",
"meeting_date": "2026-05-08"
}
Output:
{
"status": "success",
"minutes": {
"title": "Q2 招商推进会纪要",
"date": "2026-05-08",
"agenda": ["...", "..."],
"summary": "...",
"decisions": ["..."],
"action_items": [
{"assignee": "...", "task": "...", "deadline": "..."}
]
}
}
6. smart_archive
功能: 智能归档工具。
输入: 文件路径列表 + 分类标签
输出: 归档目录结构和索引文件
支持: 自动分类、命名规范、索引生成
Example:
{"files": ["/path/to/a.jpg", "/path/to/b.jpg"], "category": "2026-05/名片"}
Output:
{
"status": "success",
"archive_dir": "/meetgrow_data/archive/2026-05/名片",
"indexed": 2
}
Architecture
MeetGrow AI Agent
├── Core
│ ├── agent.py # Agent 大脑 (Qwen3.6-35B-A3B)
│ ├── orchestrator.py # 多智能体协作编排
│ └── memory.py # 本地记忆管理
├── Tools
│ ├── base.py # 工具基类
│ ├── ocr_tool.py # PaddleOCR (PP-OCRv5)
│ ├── asr_tool.py # FunASR (Paraformer)
│ ├── tts_tool.py # edge-tts
│ └── doc_tool.py # 文档生成
├── Examples
│ ├── demo_card_ocr.py # 名片识别示例
│ ├── demo_meeting_minutes.py # 会议纪要示例
│ └── demo_complete_agent.py # 完整流程示例
└── Tests
└── test_ocr.py # 测试用例 (213/213 通过)
Key Features
- ✅ 纯本地运行:零云端依赖,所有工具链 (PaddleOCR/PP-OCRv5, FunASR/Paraformer, edge-tts) 均在本地执行
- ✅ Intel AI PC 适配:支持 CPU/GPU/NPU 异构加速,目标平台 Intel Core Ultra 5 125H
- ✅ 多智能体协作:7 个 Agent 协同工作,覆盖会展活动全流程
- ✅ 12 模块覆盖:从名片识别、语音转写、会议纪要到智能归档
- ✅ Hybrid AI 架构:小模型 (≤35B) + 本地工具链,低延迟、高隐私
Installation
# 环境配置
conda create -n meetgrow python=3.11
conda activate meetgrow
# 安装依赖
pip install -r requirements.txt
# 或
conda env create -f environment.yml
Usage
# 启动 Agent
python -m meetgrow_skill
# 或直接运行
python meetgrow_skill/skill.py
Testing
# 运行测试 (全部通过)
python -m pytest tests/ -v
# 结果:213/213 passed
Tags
AIPC, agent, ocr, asr, tts, office, intel-ai-pc
扫码联系在线客服