Browser Agent

Aprenda como controlar seu navegador com um agente de IA que imita ações humanas através de instruções simples em linguagem natural.

Visão geral

Browser Agentarrow-up-right é uma ferramenta de automação de navegador com IA da Oxylabs AI Studioarrow-up-right. Ele simula a navegação de um usuário real executando ações em múltiplas etapas como clicar em links, preencher formulários, rolar a página, capturar screenshots e então extrair dados estruturados – tudo controlado por prompts em linguagem natural.

Ao contrário de frameworks tradicionais de automação (por exemplo, Puppeteer ou Selenium), o Browser Agent não requer regras de scraping estáticas ou scripts manuais. Você pode descrever tarefas em inglês simples ou fornecer uma sequência de passos, e a IA as executará como um humano faria.

Você pode visualizar a ferramenta aquiarrow-up-right e integrá-la em seus fluxos de trabalho por nossos SDKs Python/JavaScript, servidor MCP ou uma de nossas integrações de terceiros.

Principais recursos

  • Controle total através do navegador com IA – execute cliques, entradas, navegação e rolagem.

  • Execução de tarefas em múltiplas etapas – defina fluxos de navegação em linguagem natural.

  • Múltiplas saídas – obtenha resultados em JSON, Markdown, HTML ou screenshots PNG.

  • Suporte a conteúdo dinâmico – interaja com páginas renderizadas por JavaScript.

  • Extração baseada em esquema – solicite JSON estruturado após a conclusão da sequência de navegação.

Como funciona

Para executar tarefas com o agente de navegador com IA, siga estes passos:

  1. Insira a URL alvo.

  2. Descreva o processo de navegação como:

    • Prompt em linguagem natural (ex.: “Abra a página de preços, aceite os cookies e extraia todos os nomes de produtos com preços.)

    • Lista estruturada de passos – forneça um array de ações do navegador com IA (click, type, navigate, wait, extract).

  3. Selecione o formato de saída: JSON, Markdown, HTML ou screenshot PNG.

  4. (Opcional) Se JSON for selecionado, defina ou gere automaticamente um esquema para estruturar os dados coletados.

Instalação

Para começar, certifique-se de ter acesso a uma chave de API (ou obtenha um teste gratuitoarrow-up-right com 1000 créditos) e Python ver. 3.10 ou superior instalado. Você pode instalar o oxylabs-ai-studio pacote usando pip:

Exemplos de código (Python)

Os exemplos a seguir mostram como usar o agente de navegador com IA para realizar navegação e extração de dados.

O exemplo abaixo captura um screenshot PNG usando o Browser Agent.

Saiba mais sobre o Browser Agent e o SDK Python do Oxylabs AI Studio em nosso repositório PyPIarrow-up-right. Você também pode conferir nosso AI Studio JavaScript SDKarrow-up-right guia para usuários JS.

Parâmetros da requisição

Parâmetro
Descrição
Valor Padrão

url*

URL inicial para navegar

user_prompt*

Prompt em linguagem natural para extração

output_format

Formato de saída (json, markdown, html, screenshot)

markdown

schema

Esquema OpenAPI para extração estruturada (obrigatório para JSON)

geo_location

Localização do proxy no formato ISO2

* – parâmetros obrigatórios

Exemplos de saída

O Browser Agent pode retornar resultados analisados ou screenshots que são fáceis de integrar em suas aplicações. Eis como nossa saída JSON se parece:

Aqui está uma saída de screenshot da nossa segunda requisição:

O Browser Agent suporta múltiplos formatos de saída ("output": "YOUR_FORMAT"):

  • json – dados estruturados usando parsing baseado em esquema.

  • markdown – dados fáceis de ler, perfeitos para fluxos de trabalho de IA e automação.

  • html – dados HTML brutos da página web.

  • screenshot – imagem PNG do conteúdo do navegador.

Casos de uso práticos

Você pode usar o AI Browser Agent de várias maneiras, incluindo:

  1. Simulação de checkout em e-commerce – adicione itens ao carrinho, aplique cupom, confirme o fluxo de finalização.

  2. Automação de busca de viagens – insira destinos, aplique filtros e extraia preços de voos ou hotéis.

  3. Scraping de busca de empregos – procure uma vaga, clique nos anúncios, extraia detalhes das vagas.

  4. Descoberta de eventos e ingressos – navegue por sites de eventos, recupere títulos, datas e preços.

Atualizado

Isto foi útil?