Browser Agent
Aprenda como controlar seu navegador com um agente de IA que imita ações humanas através de instruções simples em linguagem natural.
Visão geral
Browser Agent é uma ferramenta de automação de navegador com IA da Oxylabs AI Studio. Ele simula a navegação de um usuário real executando ações em múltiplas etapas como clicar em links, preencher formulários, rolar a página, capturar screenshots e então extrair dados estruturados – tudo controlado por prompts em linguagem natural.
Ao contrário de frameworks tradicionais de automação (por exemplo, Puppeteer ou Selenium), o Browser Agent não requer regras de scraping estáticas ou scripts manuais. Você pode descrever tarefas em inglês simples ou fornecer uma sequência de passos, e a IA as executará como um humano faria.
Você pode visualizar a ferramenta aqui e integrá-la em seus fluxos de trabalho por nossos SDKs Python/JavaScript, servidor MCP ou uma de nossas integrações de terceiros.
Principais recursos
Controle total através do navegador com IA – execute cliques, entradas, navegação e rolagem.
Execução de tarefas em múltiplas etapas – defina fluxos de navegação em linguagem natural.
Múltiplas saídas – obtenha resultados em JSON, Markdown, HTML ou screenshots PNG.
Suporte a conteúdo dinâmico – interaja com páginas renderizadas por JavaScript.
Extração baseada em esquema – solicite JSON estruturado após a conclusão da sequência de navegação.
Como funciona
Para executar tarefas com o agente de navegador com IA, siga estes passos:
Insira a URL alvo.
Descreva o processo de navegação como:
Prompt em linguagem natural (ex.: “Abra a página de preços, aceite os cookies e extraia todos os nomes de produtos com preços.)
Lista estruturada de passos – forneça um array de ações do navegador com IA (
click,type,navigate,wait,extract).
Selecione o formato de saída: JSON, Markdown, HTML ou screenshot PNG.
(Opcional) Se JSON for selecionado, defina ou gere automaticamente um esquema para estruturar os dados coletados.
Instalação
Para começar, certifique-se de ter acesso a uma chave de API (ou obtenha um teste gratuito com 1000 créditos) e Python ver. 3.10 ou superior instalado. Você pode instalar o oxylabs-ai-studio pacote usando pip:
Exemplos de código (Python)
Os exemplos a seguir mostram como usar o agente de navegador com IA para realizar navegação e extração de dados.
O exemplo abaixo captura um screenshot PNG usando o Browser Agent.
Saiba mais sobre o Browser Agent e o SDK Python do Oxylabs AI Studio em nosso repositório PyPI. Você também pode conferir nosso AI Studio JavaScript SDK guia para usuários JS.
Parâmetros da requisição
url*
URL inicial para navegar
–
user_prompt*
Prompt em linguagem natural para extração
–
output_format
Formato de saída (json, markdown, html, screenshot)
markdown
schema
Esquema OpenAPI para extração estruturada (obrigatório para JSON)
–
geo_location
Localização do proxy no formato ISO2
–
* – parâmetros obrigatórios
Exemplos de saída
O Browser Agent pode retornar resultados analisados ou screenshots que são fáceis de integrar em suas aplicações. Eis como nossa saída JSON se parece:
Aqui está uma saída de screenshot da nossa segunda requisição:

O Browser Agent suporta múltiplos formatos de saída ("output": "YOUR_FORMAT"):
json– dados estruturados usando parsing baseado em esquema.markdown– dados fáceis de ler, perfeitos para fluxos de trabalho de IA e automação.html– dados HTML brutos da página web.screenshot– imagem PNG do conteúdo do navegador.
Casos de uso práticos
Você pode usar o AI Browser Agent de várias maneiras, incluindo:
Simulação de checkout em e-commerce – adicione itens ao carrinho, aplique cupom, confirme o fluxo de finalização.
Automação de busca de viagens – insira destinos, aplique filtros e extraia preços de voos ou hotéis.
Scraping de busca de empregos – procure uma vaga, clique nos anúncios, extraia detalhes das vagas.
Descoberta de eventos e ingressos – navegue por sites de eventos, recupere títulos, datas e preços.
Atualizado
Isto foi útil?

