# Browser Agent

## Visão geral

[**Browser Agent**](https://aistudio.oxylabs.io/apps/browser_agent) é uma ferramenta de automação de navegador com IA da [**Oxylabs AI Studio**](https://aistudio.oxylabs.io/). Ela simula a navegação de usuários reais executando ações em عدة etapas, como clicar em links, preencher formulários, rolar a página, capturar capturas de tela e depois extrair dados estruturados – tudo controlado por prompts em linguagem natural.

Ao contrário de frameworks de automação tradicionais (por exemplo, Puppeteer ou Selenium), o Browser Agent não requer regras estáticas de scraping nem scripts manuais. Você pode descrever tarefas em inglês simples ou fornecer uma sequência de etapas, e a IA as executará como um humano faria.

Você pode visualizar a ferramenta [**aqui**](https://aistudio.oxylabs.io/apps/browser_agent) e integrá-la aos seus fluxos de trabalho por meio dos nossos SDKs de Python/JavaScript, servidor MCP ou uma das nossas integrações de terceiros.

## Principais recursos

* **Controle total por meio da IA do navegador** – execute cliques, entradas, navegação e rolagem.
* **Execução de tarefas em várias etapas** – defina fluxos de navegação em linguagem natural.
* **Várias saídas** – obtenha resultados em JSON, Markdown, HTML ou capturas de tela PNG.
* **Suporte a conteúdo dinâmico** – interaja com páginas renderizadas por JavaScript.
* **Extração baseada em schema** – solicite JSON estruturado depois que a sequência de navegação for concluída.

## Como funciona

Para executar tarefas com o agente de IA do navegador, siga estas etapas:

1. **Insira a URL de destino.**
2. **Descreva o processo de navegação como:**
   * **Prompt em linguagem natural** (por exemplo, “Abra a página de preços, aceite os cookies e extraia todos os nomes de produtos com os preços.)
   * **Lista de etapas estruturada** – forneça um array de ações do navegador com IA (`click`, `type`, `navigate`, `wait`, `extract`).
3. **Selecione o formato de saída:** JSON, Markdown, HTML ou captura de tela PNG.
4. **(Opcional) Se JSON for selecionado**, defina ou gere automaticamente um schema para estruturar os dados coletados.

### Instalação

Para começar, certifique-se de que você tem acesso a uma chave de API (ou obtenha uma [teste gratuito](https://aistudio.oxylabs.io/register) com 1000 créditos) e `Python ver. 3.10` ou superior instalado. Você pode instalar o `oxylabs-ai-studio` pacote usando pip:

```sh
pip install oxylabs-ai-studio
```

### Exemplos de código (Python)

Os exemplos a seguir mostram como usar o agente de IA do navegador para realizar navegação e extração de dados.

```python
from oxylabs_ai_studio.apps.browser_agent import BrowserAgent

browser_agent = BrowserAgent(api_key="<API_KEY>")

schema = browser_agent.generate_schema(
    prompt="nome do jogo, plataforma, estrelas da avaliação e preço"
)
print("schema: ", schema)

prompt = "Descubra se há o jogo 'super mario odyssey' na loja. Se houver, encontre o preço. Use a barra de busca para encontrar o jogo."
url = "https://sandbox.oxylabs.io/"
result = browser_agent.run(
    url=url,
    user_prompt=prompt,
    output_format="json",
    schema=schema,
)
print(result.data)
```

O exemplo abaixo captura uma captura de tela PNG usando o Browser Agent.

```python
import base64
from oxylabs_ai_studio.apps.browser_agent import BrowserAgent

browser_agent = BrowserAgent(api_key="<API_KEY>")

result = browser_agent.run(
    url = "https://sandbox.oxylabs.io/",
    user_prompt= "Vá para o site e tire uma captura de tela da página inicial",
    output_format="screenshot",
)

with open("screenshot.png", "wb") as f:
    f.write(base64.b64decode(result.data.content["data"]))
```

Saiba mais sobre o Browser Agent e o SDK Python do Oxylabs AI Studio em nosso [repositório PyPI](https://pypi.org/project/oxylabs-ai-studio/).\
Você também pode conferir nosso [SDK JavaScript do AI Studio](https://github.com/oxylabs/oxylabs-ai-studio-js?tab=readme-ov-file#oxylabs-ai-studio-javascript-sdk) guia para usuários de JS.

### Parâmetros da solicitação

| Parâmetro                                                  | Descrição                                                        | Valor padrão |
| ---------------------------------------------------------- | ---------------------------------------------------------------- | ------------ |
| <mark style="background-color:green;">`url`</mark>         | URL inicial para navegar                                         | –            |
| <mark style="background-color:green;">`user_prompt`</mark> | Prompt em linguagem natural para extração                        | –            |
| `output_format`                                            | Formato de saída (`json`, `markdown`, `html`, `screenshot`)      | `markdown`   |
| `schema`                                                   | Schema OpenAPI para extração estruturada (obrigatório para JSON) | –            |
| `geo_location`                                             | Localização do proxy no formato ISO2                             | –            |

&#x20;    – parâmetros obrigatórios

### Exemplos de saída

O Browser Agent pode retornar resultados analisados ou capturas de tela fáceis de integrar aos seus aplicativos. Veja como é a nossa saída JSON:

```json
{
  "type": "json",
  "content": {
    "games": [
      {
        "game_name": "Super Mario Odyssey",
        "platform": "Nintendo Switch",
        "review_stars": null,
        "price": 89.99
      }
    ]
  }
}
```

Aqui está uma saída de captura de tela do nosso segundo pedido:

<figure><img src="https://github.com/oxylabs/browser-agent-py/raw/main/screenshot.png" alt=""><figcaption></figcaption></figure>

O Browser Agent oferece suporte a vários formatos de saída (`"output": "YOUR_FORMAT"`):

* `json` – dados estruturados usando parsing baseado em schema.
* `markdown` – dados fáceis de ler, perfeitos para fluxos de trabalho de IA e automação.
* `html` – dados HTML brutos da página da web.
* `screenshot` – imagem PNG do conteúdo do navegador.

## Casos de uso práticos

Você pode usar o AI Browser Agent de várias maneiras, incluindo:

1. **Simulação de checkout em e-commerce** – adicione itens ao carrinho, aplique cupom, confirme o fluxo de checkout.
2. **Automação de busca de viagens** – insira destinos, aplique filtros e extraia preços de voos ou hotéis.
3. **Scraping de busca de vagas** – pesquise uma função, clique nas vagas, extraia detalhes da vaga.
4. **Descoberta de eventos e ingressos** – navegue em sites de eventos, recupere títulos, datas e preços.


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://developers.oxylabs.io/products/pt-br/ai-studio/browser-agent.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
