arxiv-automation
搜索和监控arXiv论文。按主题、作者或类别查询。跟踪新论文,下载PDF,并为研究工作流程总结摘要。
把 Skill 的源码、资源快照、README、包体和安装信号放进一个可搜索、可筛选的公开目录。
搜索和监控arXiv论文。按主题、作者或类别查询。跟踪新论文,下载PDF,并为研究工作流程总结摘要。
从任何内容(书籍、文章、主题、笔记、对话)生成Obsidian MarkMind富格式思维导图。每当用户要求创建思维导图、心智图、概念图或视觉摘要时,使用此技能。当用户说'markmind'、'mindmap'、'mind map'、'mappa',或者要求可视化/映射/概要化任何内容时也触发该技能。该技能处理头脑风暴、内容提取、层级设计,并输出一个.md文件,准备好粘贴到带有MarkMind插件…
从指定的新闻网站查找用户的最新新闻。提供政治、财经、社会、世界、科技、体育和娱乐的权威网址。使用browser_use打开每个网址并使用snapshot获取内容,然后为用户总结。
小省导购员数字人带货版即梦视频提示词生成系统,基于四大智能体协同(提示词生成师、质量管控师、知识库运维师、跨环节适配师),按照"主体+运动+场景+(镜头语言+光影+氛围)"公式输出中英文双版提示词,适配5s短视频。确保人物一致性、视觉连贯性、情绪连贯性,支持知识库智能复用和跨工具适配(Suno音乐、AI绘画),为数字人带货视频提供高质量提示词生成服务。
输入各类视频网站/播客平台链接后,自动下载对应媒体文件并交付给用户。优先使用 yt-dlp 覆盖抖音(Douyin)、B站(Bilibili)、YouTube 等常见视频网站,也可用于可直接暴露音频地址的播客平台(如小宇宙单集链接)。当遇到 403/登录/年龄或地区限制时,支持使用 cookies.txt 重试;对于可能存在 DRM/加密或条款限制的平台(例如部分 Spotify 内容),应提示用…
#1 on DeepResearch Bench (2026年2月)。面向代理的任意到任意AI。通过复杂的多代理协调,结合深度推理与所有模态。研究、视频、图像、音频、仪表板、演示文稿、电子表格等。
移除图片中可见的豆包AI水印。当被要求移除豆包水印、清理豆包生成的图片或处理带有“豆包AI生成”水印的图片时使用。
剪辑、修剪和编辑带有淡入淡出效果、速度控制、拼接以及基本音频处理的音频片段。
由AI驱动的加密货币交易代理和通过自然语言实现的LLM网关。当用户想要交易加密货币、检查投资组合余额、查看代币价格、转账加密货币、管理NFT、使用杠杆、在Polymarket上下注、部署代币、设置自动化交易、签署并提交原始交易,或通过您的Bankr钱包资助的Bankr LLM网关访问LLM模型时,请使用此功能。支持Base、Ethereum、Polygon、Solana和Unichain。
xAI Grok模型选择和功能指南。在为您的任务选择合适的Grok模型、比较模型特性或优化成本时使用。
根据文本提示生成视频或为静态图像添加动画。当您需要根据描述创建视频、为图像添加动画或使用AI生成视频内容时,请使用此功能。
通过Python使用Tesseract OCR从图片中提取文本内容
使用阿里云Model Studio的Qwen图像编辑模型(qwen-image-edit、qwen-image-edit-plus、qwen-image-edit-max及其快照)编辑图片。当修改现有图片(如修复、替换、风格转换、局部编辑)、保持主体一致性或记录图像编辑请求/响应映射时,请使用这些模型。
通过Exa MCP进行免费的AI搜索。包括新闻/信息的网页搜索,来自GitHub/StackOverflow的文档/示例代码搜索,以及用于商业情报的公司研究。无需API密钥。
构建WAN 2.2文本到视频工作流程——双高低模型、闪电LoRAs、VACE模块和KSamplerAdvanced两遍处理
综合新闻聚合器,从8个主要来源抓取、过滤并深入分析实时内容:Hacker News、GitHub Trending、Product Hunt、36Kr、腾讯新闻、华尔街见闻、V2EX和微博。最适合用于'每日浏览'、'科技新闻简报'、'财经更新'以及热点话题的'深度解读'。
从文本中移除AI写作模式。在编辑、审阅或重写文本时使用,使文本听起来更自然、更像是人类所写。检测诸如夸张的象征手法、促销语言、破折号过度使用、AI词汇以及谄媚语气等模式。
使用LigandMPNN进行配体感知的蛋白质序列设计。在以下情况下使用此技能:(1)围绕小分子设计序列,(2)酶活性位点设计,(3)配体结合口袋优化,(4)金属配位位点设计,(5)辅因子结合蛋白设计。对于标准蛋白质设计,请使用proteinmpnn。对于溶解度优化,请使用solublempnn。
快速生成2-3个视频脚本大纲方案,包含标题建议、缩略图设计建议和完整的结构设计。当用户提到"视频大纲"、"视频脚本"、"视频策划"、"拍视频"、"视频内容"时使用此技能。
模拟Andrej Karpathy的代理——特斯拉前AI总监、OpenAI联合创始人、Eureka Labs创始人,以及全球最伟大的深度学习教育家。当您想要:学习深度...
使用阿里云Model Studio的Wan R2V模型(wan2.6-r2v-flash, wan2.6-r2v)生成基于参考的视频。当从参考视频/图像素材创建多镜头视频、保持角色风格或记录从参考到视频的请求/响应流程时,请使用此功能。
OpenAI的通用语音识别模型。支持99种语言,转录,翻译成英文,以及语言识别。六种型号大小从微型(39M参数)到大型(1550M参数)。可用于语音转文字、播客转录或多种语言音频处理。最适合强大且多语言的自动语音识别(ASR)。
结构化的深度学习系统,用于掌握任何主题。当被要求学习、研究或成为某个领域的专家时使用——无论是投资、加密货币、烹饪、体育、科学或其他任何领域。创建专门的大脑模块(DOMAIN-BRAIN.md),包括角色、原则、策略、反模式、决策框架和信心水平。也可以在向现有大脑咨询建议或做决定时使用。
使用Piper ONNX语音进行本地文本转语音 - 快速、私密、无需云服务。