Browser Agent
Aprende a controlar tu navegador con un agente de IA que imita acciones humanas mediante instrucciones simples en lenguaje natural.
Resumen
Browser Agent es una herramienta de automatización de navegador con IA de Oxylabs AI Studio. Simula la navegación de usuarios reales ejecutando acciones de varios pasos como hacer clic en enlaces, rellenar formularios, desplazarse, capturar capturas de pantalla y luego extraer datos estructurados, todo controlado mediante prompts en lenguaje natural.
A diferencia de los frameworks de automatización tradicionales (p. ej., Puppeteer o Selenium), Browser Agent no requiere reglas de scraping estáticas ni scripting manual. Puedes describir tareas en inglés sencillo o proporcionar una secuencia de pasos, y la IA las ejecutará igual que lo haría un humano.
Puedes previsualizar la herramienta aquí e integrarla en tus flujos de trabajo mediante nuestros SDKs de Python/JavaScript, el servidor MCP o una de nuestras integraciones de terceros.
Características principales
Control total mediante IA del navegador – ejecuta clics, entradas, navegación y desplazamiento.
Ejecución de tareas de varios pasos – define flujos de navegación en lenguaje natural.
Múltiples salidas – obtén resultados en JSON, Markdown, HTML o capturas de pantalla PNG.
Compatibilidad con contenido dinámico – interactúa con páginas renderizadas con JavaScript.
Extracción basada en esquema – solicita JSON estructurado después de que se complete la secuencia de navegación.
Cómo funciona
Para ejecutar tareas con un agente de IA del navegador, sigue estos pasos:
Introduce la URL de destino.
Describe el proceso de navegación como:
Prompt en lenguaje natural (p. ej., “Abre la página de precios, acepta cookies y extrae todos los nombres de productos con sus precios.)
Lista estructurada de pasos – proporciona un array de acciones del navegador de IA (
clic,escribir,navegar,esperar,extraer).
Selecciona el formato de salida: JSON, Markdown, HTML o captura de pantalla PNG.
(Opcional) Si se selecciona JSON, define o genera automáticamente un esquema para estructurar los datos recopilados.
Instalación
Para comenzar, asegúrate de tener acceso a una clave de API (o consigue una prueba gratuita con 1000 créditos) y Python ver. 3.10 o una versión superior instalada. Puedes instalar el oxylabs-ai-studio paquete usando pip:
Ejemplos de código (Python)
Los siguientes ejemplos muestran cómo usar el agente de IA del navegador para realizar navegación y extracción de datos.
El siguiente ejemplo captura una captura de pantalla PNG mientras usa Browser Agent.
Obtén más información sobre Browser Agent y el SDK de Python de Oxylabs AI Studio en nuestra repositorio de PyPI. También puedes consultar nuestra guía del SDK de JavaScript de AI Studio para usuarios de JS.
Parámetros de la solicitud
url
URL inicial para navegar
–
user_prompt
Prompt en lenguaje natural para la extracción
–
output_format
Formato de salida (json, markdown, html, screenshot)
markdown
schema
Esquema OpenAPI para extracción estructurada (obligatorio para JSON)
–
geo_location
Ubicación del proxy en formato ISO2
–
– parámetros obligatorios
Ejemplos de salida
Browser Agent puede devolver resultados analizados o capturas de pantalla que son fáciles de integrar en tus aplicaciones. Así es como se ve nuestra salida JSON:
Aquí tienes una salida de captura de pantalla de nuestra segunda solicitud:

Browser Agent admite múltiples formatos de salida ("output": "YOUR_FORMAT"):
json– datos estructurados usando análisis basado en esquema.markdown– datos fáciles de leer, perfectos para flujos de trabajo de IA y automatización.html– datos HTML sin procesar de la página web.screenshot– imagen PNG del contenido del navegador.
Casos de uso prácticos
Puedes usar AI Browser Agent de varias maneras, incluidas:
Simulación de checkout en comercio electrónico – añade artículos al carrito, aplica un cupón, confirma el flujo de pago.
Automatización de búsqueda de viajes – introduce destinos, aplica filtros y extrae precios de vuelos u hoteles.
Scraping de búsqueda de empleo – busca un puesto, abre las ofertas y extrae detalles del empleo.
Descubrimiento de eventos y entradas – navega por sitios de eventos, recupera títulos, fechas y precios.
Última actualización
¿Te fue útil?

