For the complete documentation index, see llms.txt. This page is also available as Markdown.

WebHarvy

将 WebHarvy 网页爬虫与 Oxylabs 住宅代理 集成。包含代理配置和身份验证的分步设置指南。

WebHarvy 是一款网页抓取工具,可从网页中提取文本、HTML 和图片。该工具支持登录、表单提交、导航、分页、定时抓取,并支持代理。

集成 Oxylabs 住宅代理 与 WebHarvy 时,请按照以下步骤操作:

步骤 1。 下载 并安装 WebHarvy 应用。

步骤 2。 设置完成后,导航到 设置。

settings

步骤 3。 点击 代理设置。选择 通过代理服务器启用网络连接 并选择 HTTP 作为你的 类型.

Proxy settings

步骤 4。 填写详细信息:

地址:pr.oxylabs.io

端口: 7777

你也可以使用随机或粘性国家/地区特定条目。例如,如果你输入 us-pr.oxylabs.io 地址10000端口下,你将获得一个美国出口节点。如果你输入 10001端口,你将获得带有粘性会话的美国出口节点。你可以在 这里 找到完整的国家/地区特定随机代理入口节点列表,以及粘性代理入口节点列表 - 这里.

步骤 5。 选择 需要身份验证 以输入你的 Oxylabs 代理 用户名密码。点击 + 按钮将你的新代理添加到列表中。

步骤 6。 点击 应用 以完成你的 WebHarvy 代理集成。

Add proxy

就是这样。现在你可以浏览互联网,并标记要抓取的特定行。通过点击 开始, 你可以开始选择目标数据。

查找原始 WebHarvy 集成博客文章 这里.

这有帮助吗?