通过 API 生成解析指令

查看如何通过向 API 发送请求来自动生成解析器。

你可以通过 API 生成解析指令集,只需提供 URL 并说明你想解析哪些数据点。收到生成的解析指令后,你可以将其保存为一个 解析器预设 ,或者直接将指令与抓取请求一起发送。

你也可以通过 OxyCopilot 在我们的网页爬虫API Playground 上生成解析指令。

从提示生成指令

你可以通过输入一段自由文本,描述你想解析的数据点,并提供几个属于同一页面类型的 URL 来生成解析指令。API 会返回一组解析指令。

  • 端点: https://data.oxylabs.io/v1/parsers/generate-instructions/prompt

  • 方法: POST

  • Authentication: 基础

  • 请求头: Content-Type: application/json

示例载荷

{ 
  "prompt_text": "解析产品标题、主价格、开发者名称和平台名称。",
  "urls": [
    "https://sandbox.oxylabs.io/products/1",
    "https://sandbox.oxylabs.io/products/2",
    "https://sandbox.oxylabs.io/products/4"
  ],
  "render": false
}
参数
说明

prompt_text

用于解析的数据点的自由文本描述。

urls

用于示例说明你希望获取解析指令的页面类型的 URL 列表。我们建议提供 3-5 个 URL,以帮助解析器适应不同布局并提高解析准确性。

render

是否应使用 JS 渲染来获取所需内容。

- 必需参数

示例响应

从 JSON schema 生成指令

有些情况下,你希望以特定的 JSON schema 获取解析后的数据。你可以使用此端点生成严格遵循你提供的 schema 的解析指令。

  • 端点: https://data.oxylabs.io/v1/parsers/generate-instructions/schema

  • 方法: POST

  • Authentication: 基础

  • 请求头: Content-Type: application/json

示例载荷

参数
说明

prompt_schema

JSON schema 用于描述所需的解析器输出。

urls

用于示例说明你希望获取解析指令的页面类型的 URL 列表。

render

是否应使用 JS 渲染来获取所需内容。

- 必需参数

示例响应

最后更新于

这有帮助吗?