Back to skills
extension
Category: Data & AnalyticsNo API key required

login

登录商家后台并处理验证码,生成并保存登录态(cookies、localStorage)。适用于需要登录才能访问的网页爬取任务。

personAuthor: user_223dc0b0hubcommunity

BrowserLoginSkill

本技能用于处理商家后台的登录流程,包括账号密码输入、验证码识别(人工或自动)以及登录态的持久化。

工作流程

  1. 初始化浏览器:使用浏览器工具打开目标商家的登录页面。
  2. 输入凭据:根据用户提供的账号和密码,定位并填充登录表单。
  3. 处理验证码
    • 如果出现验证码,首先尝试使用 OCR 或相关工具自动识别。
    • 如果自动识别失败,使用 message 工具(类型为 ask)并配合 take_over_browser 建议操作,请求用户手动完成验证码校验。
  4. 验证登录状态:登录后,检查页面是否跳转到预期的后台首页或个人中心,确认登录成功。
  5. 导出登录态
    • 获取当前页面的 cookies。
    • 获取 localStoragesessionStorage 中的关键数据。
  6. 保存登录态:将上述数据保存为 JSON 文件,建议路径为 /home/ubuntu/storage/logins/{merchant_id}_session.json

关键指令

  • "登录 [商家名称] 后台,账号:[账号],密码:[密码]"
  • "处理登录页面的验证码并保存登录态"

注意事项

  • 确保在保存登录态前,页面已完全加载且登录成功。
  • 登录态文件应包含域名信息,以便后续爬取时正确加载。