通过 API 生成解析指令

查看如何通过向 API 发送请求自动生成解析器。

您可以通过提供 URL 并描述您想要解析的数据点,通过 API 生成解析指令集。收到生成的解析指令后,您可以将它们保存为一个 解析器预设 或只需将指令与您的抓取请求一起发送。

您也可以通过 OxyCopilot 在我们的 Web Scraper API Playground 上生成解析指令。

从提示生成指令

您可以通过输入对要解析的数据点的自由文本描述并提供一些属于相同页面类型的 URL 来生成解析指令。API 会返回一组解析指令。

  • 端点: https://data.oxylabs.io/v1/parsers/generate-instructions/prompt

  • 方法: POST

  • 认证: Basic

  • 请求头: Content-Type: application/json

示例负载

{ 
  "prompt_text": "解析产品标题、主价格、开发者名称和平台名称。",
  "urls": [
    "https://sandbox.oxylabs.io/products/1",
    "https://sandbox.oxylabs.io/products/2",
    "https://sandbox.oxylabs.io/products/4"
  ],
  "render": false
}
参数
描述

prompt_text

对要解析的数据点的自由文本描述。

urls

示例化您希望获取解析指令的页面类型的 URL 列表。我们建议提供 3-5 个 URL,以帮助解析器适应不同布局并提高解析准确性。

render

是否应使用 JS 渲染来获取所需内容。

- 必填参数

示例响应

从 JSON schema 生成指令

在某些情况下,您希望以特定的 JSON schema 获取解析数据。您可以使用此端点来获得严格遵循您提供的 schema 的解析指令。

  • 端点: https://data.oxylabs.io/v1/parsers/generate-instructions/schema

  • 方法: POST

  • 认证: Basic

  • 请求头: Content-Type: application/json

示例负载

参数
描述

prompt_schema

JSON schemaarrow-up-right 描述所需解析器输出的 schema。

urls

示例化您希望获取解析指令的页面类型的 URL 列表。

render

是否应使用 JS 渲染来获取所需内容。

- 必填参数

示例响应

最后更新于

这有帮助吗?