# WebHarvy

[**WebHarvy**](https://www.webharvy.com/index.html) 是一款从网页提取文本、HTML 和图像的网页爬取工具。该工具支持处理登录、表单提交、导航、翻页、定时爬取并支持代理。

要将 Oxylabs [**住宅代理**](https://oxylabs.io/products/residential-proxy-pool) 与 WebHarvy 集成，请按以下步骤操作：

**步骤 1。** [**下载**](https://www.webharvy.com/index.html) 并安装 WebHarvy 应用。

**步骤 2。** 设置完成后，前往 **设置。**

<figure><img src="https://2655358775-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FzrXw45naRpCZ0Ku9AjY1%2Fuploads%2FD9nff9IsJ9pTi2JusJy9%2FSettings.png?alt=media&#x26;token=941db296-8079-42a2-bf71-ec0820a37bee" alt="settings"><figcaption></figcaption></figure>

**步骤 3。** 点击 **代理设置**。选择 **启用通过代理服务器的网络连接** 并选择 `HTTP` 作为您的 **类型**.

<figure><img src="https://2655358775-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FzrXw45naRpCZ0Ku9AjY1%2Fuploads%2FYBaixbNC6F8IDItzXIqj%2FProxy-settings-http.png?alt=media&#x26;token=4e1138f3-359e-48b4-a5d0-cd5476820e2a" alt="Proxy settings"><figcaption></figcaption></figure>

**步骤 4。** 填写以下信息：&#x20;

**地址：**`pr.oxylabs.io`

**端口：** `7777`

{% hint style="info" %}
您也可以使用随机或粘性（sticky）的国家特定条目。例如，如果您输入 `us-pr.oxylabs.io` 在 **地址** 和 `10000` 在 **端口**，您将获取一个美国出口节点。如果您输入 `10001` 在 **端口**，您将获得带粘性会话的美国出口节点。您可以在此处找到国家特定随机代理入口节点的完整列表 [**此处**](https://developers.oxylabs.io/proxies/residential-proxies/country-specific-entry-nodes#random-proxy-entry-nodes) 以及粘性代理入口节点的列表 - [**此处**](https://developers.oxylabs.io/proxies/residential-proxies/country-specific-entry-nodes#sticky-proxy-entry-nodes).
{% endhint %}

**步骤 5。** 选择 **需要身份验证** 以输入您的 Oxylabs 代理 **用户名** 和 **密码**。点击 + 按钮将您的新代理添加到列表中。&#x20;

**步骤 6。** 按下 **应用** 以完成您的 WebHarvy 代理集成。

<figure><img src="https://2655358775-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FzrXw45naRpCZ0Ku9AjY1%2Fuploads%2FiqPZMfrjBuIRQvVoF0vI%2FAdd-proxy.png?alt=media&#x26;token=6c0bae3a-5634-4fe9-9e37-599cdb28844b" alt="Add proxy"><figcaption></figcaption></figure>

就这样。现在您可以浏览互联网并标记要抓取的特定行。通过点击 **开始，** 您可以开始选择目标数据。

查找原始的 WebHarvy 集成博客文章 [此处](https://oxylabs.io/resources/integrations/webharvy).
