Documentation has been updated: see help center and changelog in one place.

Instrucciones para el navegador

Información sobre cómo definir instrucciones de navegador al usar Web Scraper API para manejar páginas dinámicas complejas.

Puedes definir tus propias instrucciones de navegador que se ejecutan al renderizar JavaScript.

Usage

Para usar instrucciones de navegador, proporciona un conjunto de browser_instructions al crear un job.

Supongamos que quieres buscar el término pizza boxes en un sitio web.

Los parámetros de ejemplo de un job se verían así:

Paso 1. Debes proporcionar el "render": "html" parámetro.

Paso 2. Las instrucciones del navegador deben describirse en el "browser_instructions" campo.

Las instrucciones de navegador de ejemplo anteriores especifican que el objetivo es introducir un término de búsqueda pizza boxes en un campo de búsqueda, hacer clic search en el botón y esperar 5 segundos a que cargue el contenido.

El resultado raspado debería verse así:

El HTML raspado debería verse así:

Recuperando recursos del navegador

Proveemos una instrucción de navegador independiente para recuperar recursos del navegador.

La función se define aquí:

Usar fetch_resource resultará en que el job devuelva la primera ocurrencia de un recurso Fetch/XHR que coincida con el formato proporcionado en lugar del HTML objetivo.

Digamos que queremos apuntar a un recurso GraphQL que se obtiene al visitar orgánicamente una página de producto en el navegador. Proporcionaremos la información del job así:

Estas instrucciones darán como resultado un resultado como el siguiente:

Lista de instrucciones de navegador soportadas

Lista de instrucciones

Códigos de estado

Consulta nuestros códigos de respuesta descritos aquí.

Los códigos de estado respecto a la validación de instrucciones están documentados aquí.

Errores y advertencias

Si hay un error o advertencia resultante de tus acciones de navegación, lo encontrarás en el resultado bajo las claves browser_instructions_error o browser_instructions_warnings. Por ejemplo, si has enviado las siguientes instrucciones de navegador y el xpath esperado no se encuentra en la página, el resultado incluirá una advertencia.

browser_instructions:

Resultados:

Posibles errores y advertencias

Ocurrió un error inesperado al convertir las instrucciones de navegador en acciones.

Ocurrió un error inesperado al ejecutar {action.type} instrucciones de navegador.

Acción {action.type} agotó el tiempo de espera.

No se puede encontrar el tipo de selector {selector.type} con el valor {selector.value} en la página.

Última actualización

¿Te fue útil?