自定义解析器
查看 Oxylabs 自定义解析器的快速入门步骤。
自定义解析器是一个免费的 网页爬虫 API 功能,可让您 创建解析和数据处理逻辑 这些逻辑将在原始 HTML 结果上执行。您可以使用 AI 自动生成解析器,也可以在高级场景下手动编写它们。
有关详细说明和示例,请参阅以下页面:
快速开始
1. 生成解析器
我们建议从我们的 AI 驱动工具 OxyCopilot 开始,该工具可让您无需编写任何代码即可生成爬虫和解析器。
要访问 OxyCopilot,请登录到 Oxylabs 控制台 并选择 Scraper APIs Playground 在左侧菜单中。
按照视频中显示的步骤来 生成解析器:
以下是视频中相同的步骤:
输入要抓取和解析的 URL(或多个 URL) 您想要抓取和解析的 URL
指定任何参数 例如 JavaScript 渲染
编写提示 描述您想要解析的内容
运行 OxyCopilot
一旦您对生成的解析器满意,请加载指令。
2. 将解析器另存为预设
您可以通过 OxyCopilot 轻松保存生成的解析器以备后用。请参阅以下步骤:
将预设分配 给特定的 API 用户
点击 保存
输入预设名称 和描述(可选)
保存预设后,您可以在 API 请求中使用它。
3. 在 API 请求中使用解析器
要在 Web Scraper API 中使用您的预设,请发送包含 parser_preset 参数并将其设置为您的预设名称。在下面的代码示例中,我们重复使用先前步骤中创建的 example_parser 预设。
获取已解析任务的 HTML 内容
您也可以通过在结果检索 URL 末尾添加 ?type=raw 来检索原始 HTML 结果。更多内容请阅读 此处.
最后更新于
这有帮助吗?

