Octoparse

Octoparse 是一个易于使用的数据提取工具。它允许您无需编码就能抓取公共数据,并通过启用自动 IP 轮换和延长会话时间绕过大多数反抓取机制。通过进阶机器学习算法的驱动,Octoparse 在您点击数据时迅速定位。它可以处理复杂的网站并获取各种数据,包括文本、链接、图像 URL 和 HTML 代码。

要将 Octoparse 集成到 Oxylabs Residential Proxies,请按照以下简单步骤操作:

  • 按照说明开始 Octoparse 代理集成,下载安装,然后打开 Octoparse。

  • 点击左上角的 +New(+ 新建)按钮创建一个任务,并选择 Advanced Mode(高级模式)。

  • Website(网站)字段中输入您打算提取数据的网页的 URL。我们将使用 ip.oxylabs.io 作为一个示例。点击 Save(保存)按钮。

  • 为了设置我们的代理,选择“任务”选项卡上栏上的设置图标。

  • 向下滚动到 Anti-blocking Settings(防封锁设置)。

  • Use IP Proxies(使用 IP 代理)复选标记中打上勾。完成此步骤后,您会看到 Octoparse 代理 Settings(设置)按钮。

  • 当您点击 Octoparse 代理Settings(设置)按钮时,会出现一个弹出窗口。复制并粘贴 Oxylabs 的代理 IP 地址到该字段。Octoparse 只适用于基于 IP:PORT 的格式。例如,如果您想使用我们的轮换住宅代理,您可以使用188.40.239.128:7777

  • 根据您使用的是旋转或粘性会话类型,设置 Switch 间隔时间。

  • 通过点击Confirm(确认)按钮来保存更改。

  • 为确保 Octoparse 集成成功,检查 Anti-blocking settings(防封锁设置)部分的 Settings(设置)旁边是否有一个复选标记。

  • 点击Save(保存)按钮。

设置完成!设置完成,您可以准备就绪使用 Octoparse 专注于您的网络抓取任务。

Last updated