> For the complete documentation index, see [llms.txt](https://developers.oxylabs.io/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://developers.oxylabs.io/integrations/pt-br/proxy-integrations/dedicated-datacenter-proxies-guides/self-service/octoparse.md).

# Octoparse

[**Octoparse**](https://www.octoparse.com/) é uma ferramenta de extração de dados. Ela permite raspar dados públicos sem programar e lidar com a maioria dos desafios de scraping, ao habilitar rotação automática de IP e tempo de sessão estendido.

Para integrar o Octoparse com Oxylabs [**Dedicated Datacenter Proxies**](https://oxylabs.io/products/datacenter-proxies/dedicated-datacenter-proxies)**,** siga os passos simples abaixo:

**Etapa 1.** [**Baixe**](https://www.octoparse.com/download/mac), instale e depois abra o Octoparse.

**Etapa 2.** Crie uma nova tarefa clicando no **+Novo** botão no canto superior esquerdo e escolhendo **Tarefa personalizada.**

<figure><img src="/files/3b9ce6e8fe36b023ec9461ba9b7ae3783147e340" alt=""><figcaption></figcaption></figure>

**Etapa 3.** Digite a URL da página da web de onde você pretende extrair dados no **Campo de entrada de URL** e clique no **Salvar** botão. Usaremos [**sandbox de scraping da Oxylabs**](https://sandbox.oxylabs.io/products/category/pc) como exemplo.

<figure><img src="/files/2bb4d6a9cf1bb3bbeae594339b9fa5a93f8f5b79" alt=""><figcaption></figcaption></figure>

**Etapa 4.** Depois que a URL selecionada carregar, vá para **"Configurações da tarefa"** e selecione **"Anti-bloqueio"**.

<figure><img src="/files/2400c1843b12d9f4b8fd021def7599f557b0ff71" alt=""><figcaption></figcaption></figure>

<figure><img src="/files/94dac724424c7208576ed5d6b044dff244a6d7a1" alt=""><figcaption></figcaption></figure>

**Etapa 5.** Agora, marque **Acessar sites via Proxies**, habilite **Usar meus próprios Proxies,** e clique em **Configurar**.

<figure><img src="/files/6685c74793e8fc858514bb5ef4a2eb258299c481" alt=""><figcaption></figcaption></figure>

**Etapa 6.** Quando você clicar no **Configurar** botão, uma janela pop-up aparecerá. Especifique os detalhes do proxy no seguinte formato: `IP/host:port:user-username:password`.

Para **Dedicated Datacenter Proxies**, você pode usar:&#x20;

**IP/host:** `ddc.oxylabs.io`

**Porta:** `8001`

{% hint style="info" %}
Você precisará escolher uma porta atribuída a um endereço IP da [**lista de Proxies**](/products/pt-br/proxies/dedicated-datacenter-proxies/self-service/proxy-list.md)**,** que você pode encontrar no painel da Oxylabs.
{% endhint %}

**Nome de usuário:** `user-username`

**Senha:** `password`

{% hint style="warning" %}
Não se esqueça de adicionar a `user-` parte ao seu nome de usuário.
{% endhint %}

<figure><img src="/files/e4c70074a5ba79490cc4b1935fb2d9ef9b1cd31c" alt=""><figcaption></figcaption></figure>

**Etapa 7.** Configure o **intervalo do Switch** de acordo com o tipo de sessão que você usar: rotativa ou persistente.

<figure><img src="/files/fe5700eebfffda4cd7b169c7c0b8e3e799c57b85" alt=""><figcaption></figcaption></figure>

**Etapa 8.** Salve as alterações clicando no **Confirmar** botão e, depois disso, clique em **Salvar**.

Os Proxies agora estão configurados.

### Como começar a raspar usando o Octoparse

**Etapa 1.** Selecione os elementos desejados (títulos de videogames) que você quer raspar. Para extrair todos os elementos da mesma categoria, escolha **Selecionar todos os elementos semelhantes** e especifique **Texto**.

<figure><img src="/files/f576a2563a45fc252a9dd9c894cfefaea374a622" alt=""><figcaption></figcaption></figure>

<figure><img src="/files/b13545ce3823b506ae2e8114df0c4140f0faf97b" alt=""><figcaption></figcaption></figure>

**Etapa 2.**  Configure a paginação para raspar várias páginas. Este site específico usa páginas numeradas, o que faz você escolher **Botão da próxima página**.

<figure><img src="/files/925aea67e15bdb19cc5dea842cdd598f0edede43" alt=""><figcaption></figcaption></figure>

**Etapa 3.** Escolha o botão exato no layout da página que abre a página seguinte – **Avançar** – para automatizar a paginação.

<figure><img src="/files/56f249571ce4c54a038fe1e91f8d546e703a9545" alt=""><figcaption></figcaption></figure>

**Etapa 4.** Conclua a configuração da raspagem e pressione **▶Executar**.

<figure><img src="/files/b1e42195a582d6f644469a6021e02762df7c35aa" alt=""><figcaption></figcaption></figure>

**Etapa 5.** Escolha **Executar no seu dispositivo** com **Modo padrão** para receber os dados como um arquivo no seu PC.

<figure><img src="/files/526b2b804622979b17d36accd1f2162c412d354d" alt=""><figcaption></figcaption></figure>

**Etapa 6.** Deixe o processo de raspagem ser executado até a conclusão. O processo terminará quando a página final do produto for alcançada ou quando você o parar manualmente.

<figure><img src="/files/38d0a80d49d815b686dd86607936840c6bd6ee9d" alt=""><figcaption></figcaption></figure>

**Etapa 7.** Extraia os dados coletados e selecione o formato do arquivo.

<figure><img src="/files/05bcd94d792a3c5ac0a0d92e09aab315476b614b" alt=""><figcaption></figcaption></figure>

<figure><img src="/files/3fbd884fdcd89a3b595322465364057d3afccfef" alt=""><figcaption></figcaption></figure>

Aqui está o resultado final em uma planilha.

<figure><img src="/files/04b78611fbc288b694a834b5690bffa6182cbc75" alt=""><figcaption></figcaption></figure>

É isso – tudo está configurado e pronto para que você se concentre em suas tarefas de web scraping com o Octoparse.


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://developers.oxylabs.io/integrations/pt-br/proxy-integrations/dedicated-datacenter-proxies-guides/self-service/octoparse.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
