Browser Agent
Aprenda a controlar seu navegador com um agente de IA que imita ações humanas por meio de instruções simples em linguagem natural.
Visão geral
Browser Agent é uma ferramenta de automação de navegador com IA da Oxylabs AI Studio. Ela simula a navegação de usuários reais executando ações em عدة etapas, como clicar em links, preencher formulários, rolar a página, capturar capturas de tela e depois extrair dados estruturados – tudo controlado por prompts em linguagem natural.
Ao contrário de frameworks de automação tradicionais (por exemplo, Puppeteer ou Selenium), o Browser Agent não requer regras estáticas de scraping nem scripts manuais. Você pode descrever tarefas em inglês simples ou fornecer uma sequência de etapas, e a IA as executará como um humano faria.
Você pode visualizar a ferramenta aqui e integrá-la aos seus fluxos de trabalho por meio dos nossos SDKs de Python/JavaScript, servidor MCP ou uma das nossas integrações de terceiros.
Principais recursos
Controle total por meio da IA do navegador – execute cliques, entradas, navegação e rolagem.
Execução de tarefas em várias etapas – defina fluxos de navegação em linguagem natural.
Várias saídas – obtenha resultados em JSON, Markdown, HTML ou capturas de tela PNG.
Suporte a conteúdo dinâmico – interaja com páginas renderizadas por JavaScript.
Extração baseada em schema – solicite JSON estruturado depois que a sequência de navegação for concluída.
Como funciona
Para executar tarefas com o agente de IA do navegador, siga estas etapas:
Insira a URL de destino.
Descreva o processo de navegação como:
Prompt em linguagem natural (por exemplo, “Abra a página de preços, aceite os cookies e extraia todos os nomes de produtos com os preços.)
Lista de etapas estruturada – forneça um array de ações do navegador com IA (
click,type,navigate,wait,extract).
Selecione o formato de saída: JSON, Markdown, HTML ou captura de tela PNG.
(Opcional) Se JSON for selecionado, defina ou gere automaticamente um schema para estruturar os dados coletados.
Instalação
Para começar, certifique-se de que você tem acesso a uma chave de API (ou obtenha uma teste gratuito com 1000 créditos) e Python ver. 3.10 ou superior instalado. Você pode instalar o oxylabs-ai-studio pacote usando pip:
Exemplos de código (Python)
Os exemplos a seguir mostram como usar o agente de IA do navegador para realizar navegação e extração de dados.
O exemplo abaixo captura uma captura de tela PNG usando o Browser Agent.
Saiba mais sobre o Browser Agent e o SDK Python do Oxylabs AI Studio em nosso repositório PyPI. Você também pode conferir nosso SDK JavaScript do AI Studio guia para usuários de JS.
Parâmetros da solicitação
url
URL inicial para navegar
–
user_prompt
Prompt em linguagem natural para extração
–
output_format
Formato de saída (json, markdown, html, screenshot)
markdown
schema
Schema OpenAPI para extração estruturada (obrigatório para JSON)
–
geo_location
Localização do proxy no formato ISO2
–
– parâmetros obrigatórios
Exemplos de saída
O Browser Agent pode retornar resultados analisados ou capturas de tela fáceis de integrar aos seus aplicativos. Veja como é a nossa saída JSON:
Aqui está uma saída de captura de tela do nosso segundo pedido:

O Browser Agent oferece suporte a vários formatos de saída ("output": "YOUR_FORMAT"):
json– dados estruturados usando parsing baseado em schema.markdown– dados fáceis de ler, perfeitos para fluxos de trabalho de IA e automação.html– dados HTML brutos da página da web.screenshot– imagem PNG do conteúdo do navegador.
Casos de uso práticos
Você pode usar o AI Browser Agent de várias maneiras, incluindo:
Simulação de checkout em e-commerce – adicione itens ao carrinho, aplique cupom, confirme o fluxo de checkout.
Automação de busca de viagens – insira destinos, aplique filtros e extraia preços de voos ou hotéis.
Scraping de busca de vagas – pesquise uma função, clique nas vagas, extraia detalhes da vaga.
Descoberta de eventos e ingressos – navegue em sites de eventos, recupere títulos, datas e preços.
Atualizado
Isto foi útil?

