article
README
🚀 使用双子星图像生成器MCP服务器创建高质量图像
本项目借助Google的双子星模型,通过MCP协议实现从文本提示到高质量图像的生成,能帮助用户轻松创建和管理AI生成的图像。
🚀 快速开始
此MCP服务器允许任何AI助手使用Google的双子星AI模型生成图像。该服务器处理提示工程、文字转图像转换、文件名生成和本地图像存储,使得通过任何MCP客户端创建和管理AI生成的图像变得简单易行。
✨ 主要特性
- 使用Gemini 2.0版本Flash从文本提示生成图像
- 基于文本提示对现有图像进行变换
- 支持基于文件和Base64编码的图像处理
- 自动生成唯一的哈希文件名以避免重复
- 保存所有生成和转换的图像到指定路径
📦 安装指南
安装要求
- Python 3.8或更高版本
- 虚拟环境管理工具(如venv或uv)
必要依赖项
在运行server.py之前,必须安装以下Python包:
fastapi==0.68.1
python-multipart==0.2.1
requests>=2.25.1
Pillow>=9.0.1
安装步骤
- 克隆仓库:
git clone https://github.com/your-username/gemini-image-generator.git
cd gemini-image-generator
- 创建虚拟环境并安装依赖:
python -m venv .venv
source .venv/bin/activate
pip install -e .
- 复制示例环境文件并配置参数:
cp .env.example .env
- 编辑
.env文件添加API密钥和输出路径:
GEMINI_API_KEY="your-gemini-api-key-here"
OUTPUT_IMAGE_PATH="/path/to/save/images"
配置Claude Desktop
在claude_desktop_config.json中添加以下内容:
{
"mcpServers": {
"gemini-image-generator": {
"command": "uv",
"args": [
"--directory",
"/absolute/path/to/gemini-image-generator",
"run",
"server.py"
],
"env": {
"GEMINI_API_KEY": "GEMINI_API_KEY",
"OUTPUT_IMAGE_PATH": "OUTPUT_IMAGE_PATH"
}
}
}
}
💻 使用示例
基础用法
生成新图像的请求格式
GeminiImageGenerator.create_image(
prompt: str,
width: int = 512,
height: int = 512,
quality: int = 90,
style: str = "realistic",
) -> dict:
图像变换的请求格式
GeminiImageGenerator.transform_image(
image_path_or_url: str,
prompt: str,
width: Optional[int] = None,
height: Optional[int] = None,
quality: int = 90
) -> dict:
📚 详细文档
双子星MCP服务器功能
生成新图像
通过文本提示创建全新的图像。支持多种艺术风格和图像尺寸。
- 提供文字描述即可生成创意图像
- 支持调整参数如宽度、高度和质量
- 自动生成唯一文件名保存到指定输出路径
转换现有图像
对已存在的图像进行变换或编辑:
- 在现有图像上应用视觉效果
- 修改光照、颜色平衡等属性
- 添加或删除图像元素
- 改变场景氛围和主题
使用方法
安装完成后,可以通过以下方式生成或变换图像:
生成新图像
- 提供详细的文字描述
- 支持调整尺寸和质量参数
- 自动生成并保存到指定路径
转换现有图像
- 上传本地文件或提供网络URL
- 基于提示进行智能编辑
- 支持裁剪、旋转和滤镜应用
测试与调试
可以通过FastMCP开发服务器进行测试:
fastmcp dev server.py
启动后,可以在http://localhost:5173/访问MCP Inspector界面,直接测试图像生成工具而无需使用Claude或其他客户端。
📄 许可证
MIT License
扫码联系在线客服