Documentation has been updated: see help center and changelog in one place.

WebHarvy

WebHarvy 是一款从网页提取文本、HTML 和图像的网页爬取工具。该工具处理登录、表单提交、导航、分页、定时爬取,并支持代理。

要将 Oxylabs 移动代理 (Mobile Proxies) 使用 WebHarvy,请按以下步骤操作:

第 1 步。 下载 并安装 WebHarvy 应用。

第 2 步。 设置完成后,导航到 设置。

settings

第 3 步。 点击 代理设置。选择 通过代理服务器启用网络连接 并选择 HTTP 作为您的 类型.

Proxy settings

第 4 步。 填写详细信息:

地址:pr.oxylabs.io

端口 (Port): 7777

您也可以使用随机或粘性、针对特定国家/地区的入口。例如,如果您输入 us-pr.oxylabs.io 地址10000端口下,您将获得一个美国出口节点。如果您在 10001端口下输入,您将获得具有粘性会话的美国出口节点。您可以在此处找到国家特定随机代理入口节点的完整列表 此处 以及粘性代理入口节点的列表 - 此处.

第 5 步。 选择 需要认证 以输入您的 Oxylabs 代理 用户名密码。点击 + 按钮将您的新代理添加到列表中。

第 6 步。 按下 应用 以完成您的 WebHarvy 代理集成。

Add proxy

就是这些。现在您可以浏览互联网并标记要爬取的特定行。点击 开始, 您就可以开始选择目标数据。

查找原始的 WebHarvy 集成博文 此处.

最后更新于

这有帮助吗?