# WebHarvy

[**WebHarvy**](https://www.webharvy.com/index.html) 是一款网页抓取工具，可从网页中提取文本、HTML 和图片。该工具支持登录、表单提交、导航、分页、定时抓取，并支持代理。

要集成 Oxylabs [**住宅代理**](https://oxylabs.io/products/residential-proxy-pool) 到 WebHarvy，请按照以下步骤操作：

**步骤 1。** [**下载**](https://www.webharvy.com/index.html) 并安装 WebHarvy 应用。

**步骤 2。** 设置完成后，导航到 **设置。**

<figure><img src="/files/20a4d5333449a45ea82f8bb56f6c8de90cb845e7" alt="settings"><figcaption></figcaption></figure>

**步骤 3。** 点击 **代理设置**。选择 **通过代理服务器启用网络连接** 并将 `HTTP` 选择为你的 **类型**.

<figure><img src="/files/af9bfb8d11d6f1330dc7de4762f88ed2dd400dcc" alt="Proxy settings"><figcaption></figcaption></figure>

**步骤 4。** 填写详细信息：&#x20;

**地址：**`pr.oxylabs.io`

**端口：** `7777`

{% hint style="info" %}
您也可以使用随机或粘性、按国家/地区划分的条目。例如，如果您输入 `us-pr.oxylabs.io` 在 **地址** 并 `10000` 在 **端口**下，您将获得一个美国出口节点。如果您输入 `10001` 在 **端口**，您将获得带有粘性会话的美国出口节点。您可以在这里找到完整的按国家/地区划分的随机代理入口节点列表 [**这里**](https://developers.oxylabs.io/proxies/residential-proxies/country-specific-entry-nodes#random-proxy-entry-nodes) 以及粘性代理入口节点列表 - [**这里**](https://developers.oxylabs.io/proxies/residential-proxies/country-specific-entry-nodes#sticky-proxy-entry-nodes).
{% endhint %}

**步骤 5。** 选择 **需要身份验证** 以输入你的 Oxylabs 代理 **用户名** 并 **密码**。点击 + 按钮将你的新代理添加到列表中。&#x20;

**步骤 6。** 按 **应用** 以完成你的 WebHarvy 代理集成。

<figure><img src="/files/0277211b1dd60eb0a60aebd0f3f5f27954a65001" alt="Add proxy"><figcaption></figcaption></figure>

就是这样。现在你可以浏览互联网并标记要抓取的特定行。点击 **开始，** 即可开始选择你的目标数据。

查找原始的 WebHarvy 集成博客文章 [这里](https://oxylabs.io/resources/integrations/webharvy).


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://developers.oxylabs.io/integrations/cn/proxy-integrations/residential-proxies-guides/webharvy.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
