# Octoparse

[**Octoparse**](https://www.octoparse.com/) 是一款数据提取工具。它允许你无需编程即可抓取公开数据，并通过启用自动 IP 轮换和延长会话时间来绕过大多数反爬机制。

将 Octoparse 与 Oxylabs 集成 [**移动代理**](broken://pages/7c50b210d807de54753cf5eb3a868b41c8c528dd)**,** 请按照以下步骤操作：

**步骤 1。** [**下载**](https://www.octoparse.com/download/mac)，安装，然后打开 Octoparse。

**步骤 2。** 通过点击 **+New** 按钮（位于左上角），然后选择 **自定义任务。**

<figure><img src="/files/0a0329f2e1c63652c7f28340128d8fff5ff8e1e6" alt=""><figcaption></figcaption></figure>

**步骤 3。** 在 **URL 输入框** 中输入你打算从中提取数据的网页 URL，并点击 **保存** 按钮。我们将以 [**Oxylabs 抓取沙箱**](https://sandbox.oxylabs.io/products/category/pc) 为例。

<figure><img src="/files/ae55d28f3c03f06e538e1155ced886113a096b2c" alt=""><figcaption></figcaption></figure>

**步骤 4。** 在所选 URL 加载完成后，前往 **任务设置** **>** **反屏蔽**.

<figure><img src="/files/634ffafe2ced3296975a06bd2f619115a1c7a4e7" alt=""><figcaption></figcaption></figure>

<figure><img src="/files/3780fc2399ab22aec4765a60316c66874011d3bf" alt=""><figcaption></figcaption></figure>

**步骤 5。** 现在，勾选 **通过代理访问网站**，启用 **使用我的代理，** 并点击 **配置**.

<figure><img src="/files/eee32ab4c99fb3693dc31e61d1f31549d4624244" alt=""><figcaption></figcaption></figure>

**步骤 6。** 当你点击 **配置** 按钮时，会弹出一个窗口。请按以下格式指定代理详情： `IP/主机:端口:用户名:密码`.

例如，如果您想使用我们的 **移动代理**，你可以使用：&#x20;

**IP/主机：** `pr.oxylabs.io`

**端口：** `7777`

**用户名：** `Oxylabs 代理用户的用户名`

**密码：** `Oxylabs 代理用户的密码`

{% hint style="info" %}
您还可以使用特定国家/地区的条目。例如，在以下位置输入 ie-pr.oxylabs.io **IP/主机** 并在以下位置输入 25000 **端口** 将获取一个爱尔兰出口节点。请参阅 [**此页面**](broken://pages/28a68230aa1c6b5c0d7313ad9fb854171cd90ca5) 以获取特定国家/地区入口节点的完整列表，或者如果您需要粘性会话，请查看 [**这里**](broken://pages/8ef9411968cc57618b61819989e2011d23021b37).
{% endhint %}

<figure><img src="/files/6d3b95ed39cd82118778d0405c5ac639b278cac8" alt=""><figcaption></figcaption></figure>

**步骤 7。** 设置 **切换** 间隔，具体取决于你使用的是轮换会话还是粘性会话类型。

<figure><img src="/files/45e38613f201f131d5cfd7a8f381603596f0368b" alt=""><figcaption></figcaption></figure>

**第 8 步。** 通过点击 **确认** 按钮保存更改，之后点击 **保存**.

代理现已设置完成。

### 如何使用 Octoparse 开始抓取

**步骤 1。** 选择你想要抓取的目标元素（电子游戏标题）。要提取同一类别中的所有元素，请选择 **选择所有相似元素** 并指定 **文本**.

<figure><img src="/files/7dc0bb1c11072e3d5eabe3339530f94889f14690" alt=""><figcaption></figcaption></figure>

<figure><img src="/files/015dcce1216c8b06b4238380922fcd36e86f855f" alt=""><figcaption></figcaption></figure>

**步骤 2。**  设置分页以抓取多个页面。这个网站使用带编号的页面，因此会提示你选择 **下一页按钮**.

<figure><img src="/files/06b89a41edb982303844d124b734cca5feb50fa7" alt=""><figcaption></figcaption></figure>

**步骤 3。** 选择页面布局中打开下一页的准确按钮—— **前进** ——以自动完成分页。

<figure><img src="/files/6ea3c7475ce7a1adad74bcea1d4a24e1b5f859be" alt=""><figcaption></figcaption></figure>

**步骤 4。** 完成抓取设置并按下 **▶运行**.

<figure><img src="/files/690b35cf6094ce497679fa6f1710a721442babc0" alt=""><figcaption></figcaption></figure>

**步骤 5。** 选择 **在你的设备上运行** ，使用 **标准模式** 将数据作为文件接收到你的电脑上。

<figure><img src="/files/a146bbfbc4f612110f56de05b6455cc7988f195e" alt=""><figcaption></figcaption></figure>

**步骤 6。** 让抓取过程运行直至完成。当到达最终产品页面或你手动停止时，过程就结束了。

<figure><img src="/files/20efba3be806b7854b52c18a0479d6bf5d0f3ba0" alt=""><figcaption></figcaption></figure>

**步骤 7。** 导出已收集的数据并选择文件格式。

<figure><img src="/files/1d674e5983e9db030b1f80b3c3451663214b40cb" alt=""><figcaption></figcaption></figure>

<figure><img src="/files/a6d6ebb9887697da0457618d3d1c62a60c04a4ac" alt=""><figcaption></figcaption></figure>

以下是电子表格中的最终结果。

<figure><img src="/files/c18af79ec285f846cf51da7fb1e6b04b112fdaff" alt=""><figcaption></figcaption></figure>

就是这样——你已经全部设置完成，可以开始专注于使用 Octoparse 进行网页抓取任务了。


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://developers.oxylabs.io/integrations/cn/proxy-integrations/mobile-proxies-guides/octoparse-1.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
