Octoparse
Last updated
Last updated
Octoparse 是一个易于使用的数据提取工具。它允许您无需编码就能抓取公共数据,并通过启用自动 IP 轮换和延长会话时间绕过大多数反抓取机制。通过进阶机器学习算法的驱动,Octoparse 在您点击数据时迅速定位。它可以处理复杂的网站并获取各种数据,包括文本、链接、图像 URL 和 HTML 代码。
要将 Octoparse 集成到 Oxylabs Residential Proxies,请按照以下简单步骤操作:
按照说明开始 Octoparse 代理集成,下载安装,然后打开 Octoparse。
点击左上角的 +New(+ 新建)按钮创建一个任务,并选择 Advanced Mode(高级模式)。
在 Website(网站)字段中输入您打算提取数据的网页的 URL。我们将使用 ip.oxylabs.io
作为一个示例。点击 Save(保存)按钮。
为了设置我们的代理,选择“任务”选项卡上栏上的设置图标。
向下滚动到 Anti-blocking Settings(防封锁设置)。
在 Use IP Proxies(使用 IP 代理)复选标记中打上勾。完成此步骤后,您会看到 Octoparse 代理 Settings(设置)按钮。
当您点击 Octoparse 代理Settings(设置)按钮时,会出现一个弹出窗口。复制并粘贴 Oxylabs 的代理 IP 地址到该字段。Octoparse 只适用于基于 IP:PORT 的格式。例如,如果您想使用我们的轮换住宅代理,您可以使用188.40.239.128:7777
。
根据您使用的是旋转或粘性会话类型,设置 Switch 间隔时间。
通过点击Confirm(确认)按钮来保存更改。
为确保 Octoparse 集成成功,检查 Anti-blocking settings(防封锁设置)部分的 Settings(设置)旁边是否有一个复选标记。
点击Save(保存)按钮。
设置完成!设置完成,您可以准备就绪使用 Octoparse 专注于您的网络抓取任务。