指令列表

探索可用的浏览指令,以使用网页爬虫 API 自动化动态浏览。

通用参数

下面定义的所有指令具有一致的参数集合。参数如下。

类型

  • 类型: Enum["click", "input", "scroll", "scroll_to_bottom", "wait", "wait_for_element", "fetch_resource"]

  • 描述: 浏览器指令类型。

timeout_s

  • 类型: 整数

  • 描述: 如果未在规定时间内完成,动作在多久后被跳过。

  • 限制: 0 < timeout_s <= 60

  • 默认值: 5

wait_time_s

  • 类型: 整数

  • 描述: 在执行下一个动作之前等待的时长。

  • 限制: 0 < wait_time_s <= 60

  • 默认值: 0

on_error

  • 类型: Enum["error", "skip"]

  • 描述: 指示在此指令失败时如何处理后续指令:

    • "error": 停止执行浏览器指令。

    • "skip": 继续执行下一条指令。

  • 默认值: "error"

带通用参数的示例

指令

click

  • 描述: 点击一个元素并等待指定的秒数。

  • 参数:

    • type: str = "click"

    • selector: dict

      • type: Enum["xpath", "css", "text"]

      • value: str

  • 示例:

input

  • 描述: 在选定的元素中输入文本。

  • 参数:

    • type: str = "input"

    • selector: dict

      • type: Enum["xpath", "css", "text"]

      • value: str

    • value: str

    • 示例:

scroll

  • 描述: 向下滚动指定像素数。

  • 参数:

    • type: str = "scroll"

    • x: 整数

    • y: 整数

  • 示例:

scroll_to_bottom

  • 描述: 在指定秒数内滚动到底部。

  • 参数:

    • type: str = "scroll_to_bottom"

  • 示例:

wait

  • 描述: 等待指定的秒数。

  • 参数:

    • type: str = "wait"

  • 示例:

wait_for_element

  • 描述: 在指定秒数内等待元素加载。

  • 参数:

    • type: str = "wait_for_element"

    • selector: dict

      • type: Enum["xpath", "css", "text"]

      • value: str

    • 示例:

fetch_resource

circle-exclamation
  • 描述: 获取第一个匹配设定模式的 Fetch/XHR 资源。

  • 参数:

    • type: str = "fetch_resource"

    • filter: 字符串(正则表达式)

    • on_error: Enum["error", "skip"]

  • 示例:

指令验证

任何关于指令格式的不一致都会导致一个 400 状态码和相应的错误消息。

例如,以下负载:

将导致:

最后更新于

这有帮助吗?