自定义解析器

查看 Oxylabs 自定义解析器的快速入门步骤。

自定义解析器是一个免费的 网页爬虫 API 功能,可让您 创建解析和数据处理逻辑 这些逻辑将在原始 HTML 结果上执行。您可以使用 AI 自动生成解析器,也可以在高级场景下手动编写它们。

有关详细说明和示例,请参阅以下页面:

入门 通过 API 生成解析器 解析器预设

手动编写指令 解析函数列表


快速开始

1. 生成解析器

我们建议从我们的 AI 驱动工具 OxyCopilot 开始,该工具可让您无需编写任何代码即可生成爬虫和解析器。

按照视频中显示的步骤来 生成解析器:

以下是视频中相同的步骤:

  1. 输入要抓取和解析的 URL(或多个 URL) 您想要抓取和解析的 URL

  2. 指定任何参数 例如 JavaScript 渲染

  3. 编写提示 描述您想要解析的内容

  4. 运行 OxyCopilot

一旦您对生成的解析器满意,请加载指令。

2. 将解析器另存为预设

您可以通过 OxyCopilot 轻松保存生成的解析器以备后用。请参阅以下步骤:

  1. 将预设分配 给特定的 API 用户

  2. 点击 保存

  3. 输入预设名称 和描述(可选)

保存预设后,您可以在 API 请求中使用它。

3. 在 API 请求中使用解析器

要在 Web Scraper API 中使用您的预设,请发送包含 parser_preset 参数并将其设置为您的预设名称。在下面的代码示例中,我们重复使用先前步骤中创建的 example_parser 预设。

输出示例

获取已解析任务的 HTML 内容

您也可以通过在结果检索 URL 末尾添加 ?type=raw 来检索原始 HTML 结果。更多内容请阅读 此处.

最后更新于

这有帮助吗?