Back to MCP directory
publicPublicdnsLocal runtime

lyra-intel

Lyra Intel是一个用于大规模代码库分析的完整智能基础设施引擎,结合了深度代码分析、AI驱动的洞察、语义搜索和安全扫描,支持从本地到企业级的部署,提供全面的代码理解、安全审计和智能洞察功能。

article

README

🚀 Lyra Intel

Lyra Intel 是一个完整的智能基础设施引擎,用于大规模代码库分析。它能借助人工智能驱动的洞察、安全扫描和语义搜索,以快 10 - 100 倍的速度分析代码库。

🚀 快速开始

只需几条命令,即可快速上手,无需复杂设置。

# 1. 克隆仓库
git clone https://github.com/nirholas/lyra-intel.git
cd lyra-intel

# 2. 安装(需要 Python 3.9+)
pip install -e .

# 3. 快速扫描 - 查看 Lyra Intel 在 30 秒内的发现
python cli.py scan /path/to/any/code

# 4. 全面分析 - 生成详细报告
python cli.py analyze /path/to/code --output ./results.json

# 5. 查看结果
cat results.json | jq .  # 美化打印 JSON

# 6. (可选)启动 Web 仪表盘
python launch_dashboard.py
# 然后访问 http://localhost:8080

预期结果

运行 scan 命令后,你将看到:

✅ Analyzing repository...
📊 Files analyzed: 156
📈 Total functions: 1,247
⚠️  Issues found: 43
🔐 Security findings: 5

运行 analyze 命令将生成详细的 JSON 文件,包含:

  • 指标:行数、复杂度、测试覆盖率
  • 安全:漏洞、密钥检测
  • 依赖:导入关系、循环依赖
  • 模式:代码异味、反模式
  • Git 历史:提交统计、贡献者

查看更多快速示例 →

✨ 主要特性

Lyra Intel 包含 70 多个按功能组织的专业组件:

查看所有特性(70 + 组件)

核心分析 - 理解你的代码

  • 📁 文件爬虫:并行目录遍历,支持流式处理,内存高效。可处理数百万个文件而无内存问题。
  • 📜 Git 收集器:完整的提交历史、责备分析、贡献者统计。了解谁在何时更改了什么。
  • 🔍 AST 分析器:多语言语法树解析(Python、JS/TS、Go、Rust、Java、C++、C#、Ruby、PHP)。获取准确的代码结构。
  • 🔗 依赖映射器:构建完整的依赖图,支持循环检测。了解你的架构。
  • ⚠️ 模式检测器:查找代码异味、反模式、安全问题。在问题变得严重之前检测到它们。

可扩展性 - 从笔记本电脑到企业级应用

  • 🖥️ 本地模式:单机器分析,适用于开发。无需设置,可立即在你的机器上运行。
  • 🌐 分布式模式:多工作进程处理,适用于更大的代码库。高效扩展分析到 100K + 文件。
  • ☁️ 云大规模模式:自动扩展的云基础设施(AWS、GCP、Azure)。分析包含数百万个文件的单体代码库。

存储选项 - 任何规模都具备灵活性

  • SQLite:本地开发和小型项目。内置,无依赖。
  • PostgreSQL:生产部署。可靠、成熟、可扩展。
  • BigQuery:大规模分析。可即时查询 100 万 + 分析结果。
  • 缓存层:内存、文件、Redis 后端,支持 TTL/LRU 淘汰。加速重复分析。

🔐 安全 - 在漏洞造成破坏之前发现它们

  • 安全扫描器:检测 OWASP 十大漏洞、硬编码密钥、SQL 注入。扫描 50 + 种漏洞模式。
  • 漏洞数据库:跟踪已知的 CVE 和公告。及时了解新兴威胁。
  • 自定义规则:定义自定义安全模式。强制执行你的组织的安全标准。

🤖 AI 集成 - 获取更智能的洞察

  • AI 分析器:代码解释、错误检测、重构建议。立即理解复杂代码。
  • 多个提供商:OpenAI(GPT - 4/3.5)、Anthropic(Claude)或本地(Ollama/llama.cpp)。选择适合你工作流程的提供商。
  • 成本效益高:使用本地模型进行免费分析,或使用云模型以获得最高准确性。

📊 可视化与报告 - 传达结果

  • 图生成器:导出为 D3.js、Mermaid、Graphviz DOT。可视化依赖关系和架构。
  • 报告生成器:执行、技术、安全、架构报告。为不同受众提供不同报告。
  • Web 仪表盘:交互式 D3.js/Cytoscape 可视化。直观地探索你的代码库。

🌐 API 与企业特性

  • REST API 服务器:15 + 个端点,支持集成。基于 Lyra Intel 进行构建。
  • 身份验证:支持 API 密钥、JWT、OAuth 2.0(SSO)、LDAP。安全的访问控制。
  • 基于角色的访问控制(RBAC):管理团队成员的权限。
  • 速率限制:保护你的基础设施。安全扩展。

🔬 法医分析 - 发现隐藏问题

  • 法医分析器:代码与文档的双向映射。自动查找文档差距。
  • 死代码检测器:查找未使用的函数、类、导入。清理你的代码库。
  • 复杂度分析器:循环复杂度、认知复杂度、Halstead 指标。识别有问题的代码。

📋 更多功能

  • 代码生成:基于 AI 的函数/类/API 生成,支持自定义模板
  • 差异与影响分析:了解更改内容及其影响
  • 迁移规划:提供逐步指导,规划框架/版本升级
  • 代码性能分析:检测 N + 1 查询、阻塞 I/O、低效算法
  • 模式分析:从 ORM 模型进行数据库模式分析
  • 文档生成器:自动生成 API 文档和更新日志
  • 工作流引擎:定义和执行多步骤分析管道

🔍 自动发现管道(新功能)

  • GitHub 扫描器:自动从 GitHub 发现新的 MCP 加密工具
  • AI 工具分析器:使用 AI/模式匹配提取工具定义
  • 安全扫描器:扫描发现的工具是否存在漏洞
  • 注册表提交器:将批准的工具提交到 Lyra 注册表
  • 每日自动化:使用 GitHub Actions 工作流进行持续发现

查看发现文档 →

📦 安装指南

克隆仓库

git clone https://github.com/nirholas/lyra-intel.git
cd lyra-intel

安装(需要 Python 3.9+)

pip install -e .

💻 使用示例

基础用法

# 快速扫描
python cli.py scan /path/to/any/code

# 全面分析
python cli.py analyze /path/to/code --output ./results.json

高级用法

# 启动 Web 仪表盘
python launch_dashboard.py
# 然后访问 http://localhost:8080

📚 详细文档

Lyra Intel 包含全面的文档,涵盖了平台的各个方面:

核心文档

  • 📖 FEATURES.md - 详细的特性文档,包含以下内容的代码示例:

    • 语义搜索(基于机器学习的代码搜索)
    • SSO 集成(OAuth 2.0、SAML 2.0、LDAP)
    • 语言解析器(C++、C#、Ruby、PHP)
    • 插件系统
    • IDE 扩展(VS Code、JetBrains)
    • CI/CD 集成(GitLab、Bitbucket、GitHub Actions)
    • 导出格式(PDF、SARIF、Excel、CSV)
    • WebSocket 流式传输
    • 交互式 CLI
    • Web 仪表盘
    • 监控与指标(Prometheus、Grafana)
  • 💻 EXAMPLES.md - 实用的代码示例,包括:

    • 快速开始(60 秒分析)
    • 核心分析工作流
    • 语义搜索使用方法
    • SSO 设置与配置
    • 特定语言解析
    • 自定义插件开发
    • IDE 扩展安装
    • CI/CD 管道集成
    • 实时 WebSocket 流式传输
    • 监控设置
    • 完整的端到端工作流
  • 🏗️ ARCHITECTURE.md - 技术架构文档:

    • 系统概述与设计
    • 核心组件架构
    • 数据流图
    • 模块组织
    • 扩展点
    • 部署架构(单服务器、Kubernetes、AWS)
    • 性能与可扩展性
    • 安全架构
    • 技术栈
  • 🔌 API.md - 完整的 REST API 参考

  • 🚀 DEPLOYMENT.md - 部署指南(Docker、Kubernetes、AWS)

  • 📜 openapi.yaml - OpenAPI 3.0 规范

实际工作流

  • 💼 USE_CASES.md - 实用的工作流和最佳实践:
    • 保护遗留代码库
    • 提交前代码质量检查
    • CI/CD 安全管道
    • 代码审查辅助
    • 单体代码库迁移规划
    • 技术债务跟踪
    • 构建团队知识库
    • 集成模式
    • 性能优化技巧

入门指南

🔧 技术细节

架构

lyra-intel/
├── src/
│   ├── core/           # 主引擎编排
│   ├── collectors/     # 数据收集(文件、git)
│   ├── analyzers/      # 代码分析(AST、依赖、模式)
│   ├── storage/        # 数据库和持久化
│   ├── agents/         # 多智能体系统
│   ├── search/         # 代码和语义搜索
│   ├── query/          # 自然语言查询
│   ├── visualizers/    # 图生成
│   ├── reports/        # 报告生成
│   ├── web/            # Web 仪表盘
│   ├── api/            # REST API 服务器
│   ├── auth/           # 身份验证和授权
│   ├── plugins/        # 插件系统
│   ├── ai/             # AI 集成
│   ├── metrics/        # 指标收集
│   ├── events/         # 事件系统
│   ├── notifications/  # 通知和警报
│   ├── forensics/      # 法医分析
│   ├── cache/          # 缓存层
│   ├── pipeline/       # 流式管道
│   ├── testing/        # 测试基础设施
│   ├── knowledge/      # 知识图谱系统
│   ├── diff/           # 差异和影响分析
│   ├── generation/     # 代码生成
│   ├── security/       # 安全扫描
│   ├── migration/      # 迁移规划
│   ├── profiler/       # 性能分析
│   ├── schema/         # 模式分析
│   ├── docgen/         # 文档生成
│   ├── integrations/   # 外部集成
│   └── workflow/       # 工作流引擎
├── config/             # 配置文件
├── scripts/            # 实用脚本
├── Dockerfile          # 容器构建
├── docker-compose.yml  # 多服务部署
└── cli.py              # 命令行界面

处理模式

本地模式

适用于开发和小型仓库:

from src import LyraIntelEngine, EngineConfig, ProcessingMode

config = EngineConfig(mode=ProcessingMode.LOCAL, max_workers=8)
engine = LyraIntelEngine(config)
result = await engine.analyze_repository("/path/to/repo")

分布式模式

适用于具有多个工作进程的较大代码库:

config = EngineConfig(
    mode=ProcessingMode.DISTRIBUTED,
    max_workers=50,
)

云大规模模式

适用于企业级分析:

config = EngineConfig(
    mode=ProcessingMode.CLOUD_MASSIVE,
    cloud_provider="aws",
    cloud_region="us-east-1",
    max_cloud_workers=1000,
)

分析结果

引擎生成全面的分析结果,包括:

  • 文件指标:总文件数、大小、按扩展名的行数
  • 代码结构:函数、类、方法及其复杂度得分
  • 依赖:导入/导出关系、循环依赖
  • Git 历史:提交、作者、更改频率
  • 模式:代码异味、反模式、安全问题

结果存储在 SQLite(或你配置的后端)中,并可以 JSON 格式导出。

云支持

Lyra Intel 旨在高效利用云资源:

| 提供商 | 实例类型 | 支持现货实例 | 优化效果 | |----------|---------------|--------------|----------------| | AWS | EC2、Lambda、ECS | ✅ 支持 | ~70% 节省 | | GCP | Compute Engine、Cloud Run | ✅ 支持 | ~70% 节省 | | Azure | VMs、Functions | ✅ 支持 | ~70% 节省 |

包含自动扩展和成本优化功能。

💼 常见用例

实际团队使用 Lyra Intel 进行以下工作:

🔒 安全团队

“我需要扫描我们 500K 行代码的代码库以查找漏洞”

  • 保护遗留代码库 - 30 分钟内完成全面审计
  • 自动 CI/CD 安全检查
  • 提交前钩子,阻止不安全的代码
  • 定期安全扫描

👨‍💻 开发团队

“新开发人员加入 - 如何让他们在 200K 行代码的代码库中快速上手?”

  • 构建团队知识库 - 对代码库进行语义搜索
  • 查找相似的代码模式
  • 通过可视化了解架构
  • 跟踪技术债务

🏗️ 平台团队

“我们需要从 Node 14 升级到 Node 18 - 是否安全?”

📊 工程负责人

“我们的代码质量是在提高还是在下降?”

  • 跟踪技术债务 - 每月趋势跟踪
  • 可视化指标随时间的变化
  • 优先修复问题
  • 向管理层展示基于数据的报告

🔍 代码审查

“每次拉取请求的审查时间太长 - 每个 PR 需要 30 分钟”

查看 7 个完整的工作流及代码示例 →

🤖 MCP 集成(Claude 与大语言模型)

可以直接从 Claude、Claude Code 或任何支持 MCP 的大语言模型中使用 Lyra Intel。

快速设置

# Claude Code - 一条命令
npx lyra-intel-mcp

# Claude Desktop - 添加到配置
{
  "mcpServers": {
    "lyra-intel": {
      "command": "npx",
      "args": ["-y", "lyra-intel-mcp"]
    }
  }
}

可用的 MCP 工具

| 工具 | 描述 | |------|-------------| | analyze-codebase | 综合代码分析,包括 AST、依赖、指标 | | search-code | 基于机器学习的语义代码搜索 | | get-complexity | 循环复杂度、认知复杂度和 Halstead 复杂度 | | get-security-issues | 安全漏洞、密钥、合规性检查 | | discovery-scan-github | 在 GitHub 上查找新的 MCP 加密工具 | | discovery-analyze-repo | 从仓库中提取 MCP 工具定义 | | discovery-run-pipeline | 完整的发现 + 分析 + 提交流程 |

示例提示

"Analyze my project at ~/code/myapp for security issues"
"Search for authentication patterns in the codebase"
"Scan GitHub for new MCP crypto tools from the last 7 days"
"Run the discovery pipeline and submit approved tools"

查看完整的 MCP 文档 →

🏛️ 架构

架构概述

Lyra Intel 的架构设计旨在提供高效、可扩展和安全的代码分析解决方案。它包含多个核心组件,每个组件负责特定的功能,这些组件协同工作以实现全面的代码分析。

组件架构

  • 核心引擎:负责整体的编排和协调,确保各个组件之间的流畅交互。
  • 数据收集器:从文件系统和 Git 仓库中收集代码数据。
  • 分析器:执行代码分析,包括 AST 解析、依赖映射和模式检测。
  • 存储模块:管理数据的持久化,支持多种存储选项。
  • AI 集成:与各种 AI 提供商集成,提供智能分析和洞察。
  • 可视化和报告:生成直观的图表和详细的报告,方便用户理解分析结果。

数据流程

数据从收集器进入系统,经过分析器处理后存储在存储模块中。用户可以通过 Web 仪表盘或 API 访问分析结果,可视化和报告工具将结果以易于理解的方式呈现给用户。

部署架构

支持多种部署方式,包括单服务器部署、Kubernetes 集群和云服务(如 AWS),以满足不同规模和需求的用户。

性能与可扩展性

通过分布式处理和自动扩展功能,能够高效处理大规模代码库,确保在不同负载下的性能稳定。

安全架构

采用多层次的安全措施,包括身份验证、授权和漏洞检测,保障系统和数据的安全。

技术栈

使用了多种先进的技术和框架,如 FastAPI、React、Prometheus 等,确保系统的高性能和可维护性。

🌐 实时 HTTP 部署

Lyra Intel 通过 MCP 可流式 HTTP 传输协议进行部署,可通过 HTTP 访问,无需本地安装。

端点

https://modelcontextprotocol.name/mcp/lyra-intel

从任何 MCP 客户端连接

将以下配置添加到你的 MCP 客户端配置文件(Claude Desktop、Cursor、SperaxOS 等)中:

{
  "mcpServers": {
    "lyra-intel": {
      "type": "http",
      "url": "https://modelcontextprotocol.name/mcp/lyra-intel"
    }
  }
}

可用工具(6 个)

| 工具 | 描述 | |------|-------------| | analyze_repo | 分析 GitHub 仓库 | | get_repo_tree | 获取仓库文件树 | | search_code | 搜索代码 | | get_file_content | 获取文件内容 | | get_repo_languages | 语言分析 | | get_recent_commits | 获取最近的提交 |

示例请求

分析 GitHub 仓库

curl -X POST https://modelcontextprotocol.name/mcp/lyra-intel \
  -H "Content-Type: application/json" \
  -d '{"jsonrpc":"2.0","id":1,"method":"tools/call","params":{"name":"analyze_repo","arguments":{"owner":"nirholas","repo":"universal-crypto-mcp"}}}'

获取仓库文件树

curl -X POST https://modelcontextprotocol.name/mcp/lyra-intel \
  -H "Content-Type: application/json" \
  -d '{"jsonrpc":"2.0","id":1,"method":"tools/call","params":{"name":"get_repo_tree","arguments":{"owner":"nirholas","repo":"agenti"}}}'

搜索代码

curl -X POST https://modelcontextprotocol.name/mcp/lyra-intel \
  -H "Content-Type: application/json" \
  -d '{"jsonrpc":"2.0","id":1,"method":"tools/call","params":{"name":"search_code","arguments":{"query":"MCP server","language":"typescript"}}}'

列出所有工具

curl -X POST https://modelcontextprotocol.name/mcp/lyra-intel \
  -H "Content-Type: application/json" \
  -d '{"jsonrpc":"2.0","id":1,"method":"tools/list"}'

也可在以下平台使用

modelcontextprotocol.name 提供支持 — 开放的 MCP HTTP 网关

📈 指标与监控

可在以下地址访问指标:

  • Prometheushttp://localhost:9090
  • Grafanahttp://localhost:3000
  • API 健康检查http://localhost:8080/api/v1/health

关键指标:

  • lyra_intel_requests_total - 总 API 请求数
  • lyra_intel_analysis_duration_seconds - 分析性能
  • lyra_intel_ai_tokens_total - AI 使用跟踪
  • lyra_intel_cache_hits_total - 缓存效率

🤝 贡献

我们欢迎贡献!请参阅 CONTRIBUTING.md 获取贡献指南。

🐛 故障排除

常见问题及解决方案:

数据库连接失败

docker-compose restart postgres
docker-compose logs postgres

内存使用率高

# 减少工作进程
export WORKERS=4

# 增加内存限制
docker-compose up -d --scale api=1 --memory 4g

API 速率限制

# 增加配置中的速率限制
export RATE_LIMIT_PER_MINUTE=1000

查看完整的故障排除指南 →

📊 项目状态

  • ✅ 核心分析引擎
  • ✅ 多语言支持(10 + 种语言)
  • ✅ AI 集成(OpenAI、Anthropic、Ollama)
  • ✅ 安全扫描(OWASP、密钥、依赖)
  • ✅ 导出格式(JSON、HTML、PDF、SARIF、CSV、Excel)
  • ✅ IDE 插件(VS Code、JetBrains)
  • ✅ 平台集成(GitHub、GitLab、Bitbucket)
  • ✅ 云部署(AWS、Kubernetes、Docker)
  • ✅ 实时流式传输(WebSocket)
  • ✅ Web 仪表盘(React)
  • ✅ 监控(Prometheus、Grafana)
  • ✅ 企业特性(SSO、RBAC、审计日志)

🌟 展示你的支持

如果你觉得 Lyra Intel 有帮助,不妨考虑:

  • 给这个仓库加星 - 帮助更多人发现这个项目
  • 🐛 报告问题 - 通过报告漏洞帮助我们改进
  • 💡 分享想法 - 提出功能和改进建议
  • 🤝 贡献代码 - 请参阅 CONTRIBUTING.md 获取贡献指南
  • 📢 传播消息 - 与你的团队和社区分享

每一个星星、贡献和推荐都有助于壮大社区!

🙏 致谢

使用了以下出色的开源工具构建:

📧 联系与支持

📄 许可证

本项目采用 MIT 许可证 - 详情请参阅 LICENSE 文件。

nich 用心打造 | 在 X.com 关注我

help

Runtime guide

cloud

Hosted runtime

Hosted servers run from a provider-managed environment. You usually connect the MCP client to the hosted endpoint or follow the provider's authorization flow, without keeping a local process alive

  1. Open provider connection page
  2. Authorize or copy endpoint
  3. Connect from your MCP client
terminal

Local runtime / other methods

Local servers run on your own machine or infrastructure. You normally copy the server_config into your MCP client, install the required package, and provide env variables from env_schema when needed

  1. Copy server_config
  2. Install required package
  3. Fill env variables and restart client