china-doc-ocr
智能文档OCR识别与结构化提取。用于用户有复杂文档、PDF、扫描件、照片、发票、收据、身份证、表格或图表需要识别并提取信息时。
把 Skill 的源码、资源快照、README、包体和安装信号放进一个可搜索、可筛选的公开目录。
智能文档OCR识别与结构化提取。用于用户有复杂文档、PDF、扫描件、照片、发票、收据、身份证、表格或图表需要识别并提取信息时。
为AI代理设置Spark比特币L2钱包功能。使用助记词初始化钱包,转账sats和代币,创建/支付闪电发票,支付L40...
自动化从本地媒体及云编辑 API生成剪映草稿。当 Codex 需要扫描素材文件夹、请求编辑决策并...时使用。
中国城市出行服务:支持打车/网约车、价格查询、公交/驾车/步行/骑行路线规划、周边搜索及订单查询/取消。
当用户提供 B 站视频链接、BV 号或 b23.tv 短链,并希望转录、提取字幕、总结或分析视频内容时使用。先检查 Node.js 环境和 SILICONFLOW_API_KEY,优先尝试官方字幕;如果没有字幕,则获取匿名音频地址,下载为 .m4s 后直接改名为 .mp3,无需转码;有 API key 时调用硅基...
跨平台社交媒体内容创作的结构化技能,覆盖 Instagram、TikTok、YouTube、LinkedIn、小红书等平台,产出满足各平台要求的内容。
该技能用于指导AI生成高对比度、强共鸣、具备故事感且具有个人IP属性的短视频口播脚本。
通过URL或本地路径提升图像分辨率和清晰度,返回修复后的图像URL,用于低分辨率图像的修复和放大。
高质量语音合成,支持9个角色、11种语言并通过 Voice.ai API 流式输出。
图像抠图工具:将前景与背景分离并返回透明背景URL,适用于产品图像处理、人物抠图等。
参与Babylon预测市场-交易YES/NO份额、发布社交动态、查看投资组合和排行榜。用于与Babylon交互
专业的品牌构建流水线,涵盖从核心标识到完整视觉系统,确保创意质量、执行一致性及交付。
为各大中国电商平台的销售、价格、评论、关键词及竞争对手提供数据分析与监控服务。
完整的营销手册设计工作流技能,涵盖需求收集、布局设计到模型交付的全过程,使用“layo...”。
使用ffmpeg检测并分割视频为场景片段,为每个片段提供URL,不分析视频内容。
音视频合并工具,用于根据片段和时间线配置合并多个视频和音轨,适用于终剪、配乐和后期制作。
RunComfy上的Codex宠物生成器:将单张参考图生成Codex兼容的spritesheet.webp和pet.json,拷贝到${CODEX_HOME:-$H...
通过 Lovart AI 生成图像、视频和音频/音乐,管理 Lovart 项目、线程(对话历史)和用户设置。触发条件:(1) 任意...
获取故事板信息
专业故事板技能,服务于电影、广告、短视频和教育叙事场景,遵循严格的‘先规划,后渲染’流程。
专为亚马逊电商平台设计的产品图像生成专业技能,输出符合亚马逊图片规范并进一步优化...
作为专业的分镜脚本生成助理,你需要根据用户提供的的主题、结构化文案(如包含悬念的剧本)...
MinerU AI 文档解析器 — AI驱动的智能文档提取。解析 PDF、扫描文档、图片、Word 文件、PowerPoint 幻灯片和网页。
wechat-ai-publisher