ocr-service
高精度光学字符识别(OCR)服务。支持多语言、多格式图像的文字检测与提取,并提供文本区域坐标与置信度评分,适用于文档数字化与图像内容分析。
把 Skill 的源码、资源快照、README、包体和安装信号放进一个可搜索、可筛选的公开目录。
高精度光学字符识别(OCR)服务。支持多语言、多格式图像的文字检测与提取,并提供文本区域坐标与置信度评分,适用于文档数字化与图像内容分析。
存储和回忆顺序记忆模式及状态转换。
利用轻现AI提供的接口一句话就可以免费生成讲解类视频,自动生成脚本,自动和成语音,自动渲染视频
使用`uvx edge-tts`进行文本转语音,将文本转换为音频。在以下情况下使用:(1) 用户通过"tts"触发词或关键词请求音频/语音输出。(2) 内容需要被朗读而非阅读(如多任务处理、无障碍需求、驾驶、烹饪等场景)。(3) 用户希望TTS输出具有特定的声音、速度、音调或格式。
【深度调研专用】当需要系统性调研、多产品对比、深度分析、技术选型、趋势分析时必须使用本技能。触发关键词:调研、对比、分析、评估、选型、趋势、综合报告、多源验证。通过 3 层深度搜索(阅读多个网页)+ 多源交叉验证,提供比普通 WebSearch 更全面、更准确的研究结果和深度洞察。禁止用普通搜索工具替代深度调研任务。
多智能体协同的商品视频创作流水线,支持从商品信息到成视频的全流程创作:文案生成、故事策划、脚本创作、分镜设计、图片生成、字幕创作、音效推荐及视频合成;适用于电商商品宣传、品牌推广、社交媒体营销等场景
下载并转录来自YouTube、Bilibili、TikTok及1000多个平台的视频。当用户请求视频下载、转录(转录/字幕提取)或将视频转换为文本/Markdown时使用。支持质量选择、音频提取、播放列表下载、基于Cookie的身份验证以及通过SiliconFlow API进行的AI转录(免费转录)。
支持多种风格的知识漫画创作者(如Logicomix、Ligne Claire、欧姆社漫画指南)。能够创作出具有详细分镜布局和连续图像生成的原创教育漫画。当用户要求创建“知识漫画”、“教育漫画”、“传记漫画”、“教程漫画”或“Logicomix风格漫画”时使用。
将研究论文复现为可运行的代码。当用户希望实现机器学习/人工智能论文、复现实验、从PDF中提取算法或将研究转化为可执行代码时使用。处理多篇相互关联的论文,具备多代理提取、方程验证和基准验证功能。
AI视频生成提示指南,适用于Sora 2和Higgsfield.ai
针对数据分析、数据科学和机器学习项目的专业指导。涵盖Python数据工具、SQL/数据库、可视化、统计学、ML/AI、数据工程以及MLOps。在进行数据分析任务、选择数据工具、构建数据管道、创建可视化图表、执行统计分析或构建机器学习模型时使用。
管理知识图谱以实现自动编码。在存储关系、查询关联知识、构建项目理解或维护语义记忆时使用。
通过知识图谱构建和有状态的多跳推理处理大型文档语料库(1000+文档,数百万个词汇)。当(1)用户提供超出上下文限制的大规模语料库时;(2)问题需要跨多个文档进行关联时;(3)复杂查询需要多跳推理时;(4)用户希望从文档中获得持久可查询的知识时使用。用智能图遍历代替暴力文档填充。
根据用户提供的图片和创作需求,生成专业的即梦 Seedance 2.0 视频脚本 Prompt。融合影视理论(景别、运镜、构图、色彩、声音设计)与 Seedance 2.0 多模态语法(@素材名引用)。专为潮玩手办/玩偶IP角色视频创作优化。当用户提到生成视频脚本、Seedance prompt、即梦提示词、AI视频分镜、视频脚本创作、玩偶视频时使用。
FFmpeg自动化用于剪切、修剪、拼接视频。音频混合、时间线编辑、转场、效果。针对YouTube、社交媒体的导出优化。字幕处理、色彩分级、批量处理。用于videogen项目、内容创作、自动视频制作。在“视频编辑”、“FFmpeg”、“修剪视频”、“拼接”、“转场”、“导出优化”时激活。不适用于实时视频编辑界面、3D合成或动态图形。
通过Jina AI Reader API进行网页内容提取。三种模式:阅读(URL转Markdown)、搜索(网络搜索+全文内容)、验证(事实核查)。提取干净的内容而不暴露服务器IP。
全面的科学研究工具包,包含139项专门技能,涵盖生物学、化学、医学、数据科学和计算研究。将Claude转变为具有访问科学数据库、分析工具和特定领域工作流程能力的人工智能研究助手。
使用FFmpeg或Remotion从生成的片段、音频和素材组装最终视频。处理拼接、音频混合、转场、标题以及导出。在需要将多个制作输出合并为最终交付成果时使用。
使用Google Gemini Deep Research Agent执行自主多步骤研究。用于:市场分析、竞争格局分析、文献综述、技术研究、尽职调查。耗时2-10...
使用Boltz-1/Boltz-2,一个开放的生物分子结构预测器进行结构预测。在以下情况下使用此技能:(1) 预测蛋白质复合体结构,(2) 验证设计的结合物,(3) 需要AF2的开源替代品,(4) 预测蛋白质-配体复合物,(5) 使用本地GPU资源。对于质量控制阈值,请使用protein-qc。对于AlphaFold2预测,请使用alphafold。对于Chai预测,请使用chai。
从文本、图像或Excel生成可编辑的draw.io图表(.drawio, .drawio.svg)。协调3个代理的工作流程(分析 → 清单 → SVG生成),并设置质量关卡。在创建架构图、流程图、序列图或将现有图像转换为可编辑格式时使用。支持Azure/AWS云图标。
为Jimeng Seedance 2.0多模态AI视频生成编写有效的提示。当用户希望使用文本、图片、视频和音频输入(通过@引用系统)创建视频提示时使用。涵盖摄像机运动、效果复制、视频扩展、编辑、音乐节拍匹配、电商广告、短剧和教育内容。
当用户明确要求"做系统综述/文献综述/related work/相关工作/文献调研"时使用。AI 自定检索词,多源检索→去重→AI 逐篇阅读并评分(1–10分语义相关性与子主题分组)→按高分优先比例选文→自动生成"综/述"字数预算→资深领域专家自由写作(固定摘要/引言/子主题/讨论/展望/结论),保留正文字数与参考文献数硬校验,强制导出 PDF 与 Word。支持多语言翻译与智能编译(en/zh/…
交互式深度学习论文引言写作助手。通过多轮对话帮助用户发现科学叙述、创新点和贡献。支持从零开始写作或润色现有的LaTeX文件。遵循标准引言结构:背景→问题→现有工作→局限性→总体方法→方法概述→三个贡献。