BrowserCrawlSkill

本技能用于在已登录的状态下，高效地抓取商家后台的页面内容。

工作流程

加载登录态：从指定路径（如 /home/ubuntu/storage/logins/{merchant_id}_session.json）读取 cookies 和 storage 数据。
注入登录态：在浏览器工具中应用这些 cookies，确保访问目标 URL 时处于登录状态。
执行爬取：
- 跳转到目标 URL。
- 自动等待页面核心元素加载完成（使用 wait_until: "networkidle" 或特定的选择器）。
处理动态内容：如果页面有滚动加载或异步请求，执行必要的滚动操作以获取完整 HTML。
发现与遍历：
- 自动识别分页按钮并循环爬取。
- 提取页面中的子链接（如订单详情页链接）并加入爬取队列。
输出结果：返回页面的完整 HTML 字符串，或将其保存为本地文件。