article
README
🚀 Markdownify MCP 服务器(UTF - 8 版)
本项目是基于原始 Markdownify 项目的增强版本,专为更好地支持 UTF - 8 编码而开发,能将多种格式文件转换为 Markdown,为您的工作带来便利。
🚀 快速开始
安装要求
- 系统:支持 Windows、macOS 或 Linux。
- 依赖:需要安装 Node.js(推荐版本:16+)和 Python 3.x。
安装指南
步骤一:克隆仓库
git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git
cd markdownify-mcp-utf8
步骤二:安装依赖
npm install
pip install -r requirements.txt
步骤三:启动服务器
node dist/index.js
✨ 主要特性
主要改进
- 全面的 UTF - 8 支持:整个项目经过优化,确保在处理中文和其他 UTF - 8 字符时表现更稳定。
- Windows 系统兼容性提升:修复了 Windows 操作系统中的多项问题,提升了用户体验。
- 改进的功能模块:
- 更强大的文件解析能力。
- 支持更多文件格式(如 PDF、PPTX 和 XLSX)。
- 提升对 YouTube 视频的处理效率。
- 增强的错误处理:包括更详细的错误日志和自定义输出路径功能。
与原项目的主要区别
- UTF - 8 支持优化:原项目在中文和其他非英语字符处理上存在一些问题,现版本已全面改进。
- Windows 系统支持增强:解决了 Windows 用户在使用过程中遇到的多项问题。
- 新增功能:提供了更灵活的环境变量配置(如
UV_PATH和MARKDOWN_OUTPUT_DIR)。
功能
- 支持将多种格式文件转换为 Markdown,包括 DOCX、PDF、PPTX、XLSX、YouTube 视频链接、网页内容。
- 提供命令行工具和桌面应用集成支持。
- 兼容 Node.js 和 Python 脚本环境。
💻 使用示例
命令行使用
基础用法
将网页转换为 Markdown:
python convert_utf8.py "https://example.com"
高级用法
- 转换本地文件
- DOCX 文件:
python convert_utf8.py "document.docx"
- PDF 文件:
python convert_utf8.py "document.pdf"
- PowerPoint 文件:
python convert_utf8.py "presentation.pptx"
- Excel 文件:
python convert_utf8.py "spreadsheet.xlsx"
- 转换 YouTube 视频
python convert Utf8_py "https://www.youtube.com/watch?v=VIDEO_ID"
批处理操作
- 创建一个包含要处理的 URL 或文件路径的文本文件(例如
convert_batch.txt):
https://example1.com
https://example2.com
file1.docx
file2.pdf
- 运行以下命令进行批量处理:
while read -r line; do python convert_utf8.py "$line"; done < convert_batch.txt
环境变量配置
基础用法
设置自定义路径:
- 设置 UV 路径:
export UV_PATH="/custom/path/to/uv"
- 设置输出目录:
export MARKDOWN_OUTPUT_DIR="/output/path"
高级用法
在 Python 脚本中使用这些环境变量。
桌面应用集成
基础用法
配置 Node.js 环境:
node dist/index.js
高级用法
Python 脚本调用示例:
import subprocess
def convert_file(file_path):
subprocess.run(["python", "convert Utf8_py", file_path])
if __name__ == "__main__":
file_path = input("请输入文件路径:")
convert_file(file_path)
⚠️ 重要提示
- 确保安装正确依赖,Node.js 和 Python 版本需满足要求。
- 处理大文件时注意性能,处理大型 PDF 或 PPT 文件可能需要更多内存和时间。
- 检查错误日志,遇到问题时,查看详细日志以快速定位。
🤝 贡献与反馈
欢迎提交 Pull Request 和 Issue!
感谢您的支持!希望这个项目能为您的工作带来便利。
Scan to contact