Documentation has been updated: see help center and changelog in one place.

WebHarvy

WebHarvy 是一款网页爬取工具,可从网页中提取文本、HTML 和图像。该工具支持处理登录、表单提交、导航、分页、定时爬取并支持代理。

要将 Oxylabs 住宅代理 与 WebHarvy 集成,请按照以下步骤操作:

步骤 1。 下载 并安装 WebHarvy 应用。

步骤 2。 设置完成后,导航到 设置。

settings

步骤 3。 点击 代理设置。选择 通过代理服务器启用网络连接 并选择 HTTP 作为您的 类型.

Proxy settings

步骤 4。 填写详细信息:

地址:pr.oxylabs.io

端口: 7777

您也可以使用随机或粘性(sticky)的按国家条目。例如,如果您输入 us-pr.oxylabs.io 地址10000端口下,您将获得一个美国出口节点。如果您在 10001端口下输入,您将获得带有粘性会话的美国出口节点。您可以在 此处 找到完整的按国家随机代理入口节点列表,以及粘性代理入口节点列表 - 此处.

步骤 5。 选择 需要身份验证 以输入您的 Oxylabs 代理 用户名密码。点击 + 按钮将新代理添加到列表中。

步骤 6。 按下 应用 以完成您的 WebHarvy 代理集成。

Add proxy

就是这些。现在您可以浏览互联网并标记要爬取的特定行。通过点击 开始, 您可以开始选择目标数据。

查找原始的 WebHarvy 集成博客文章 此处.

最后更新于

这有帮助吗?