Presets de analizador

Descubre cómo funcionan los presets de parser y cómo usarlos en tus trabajos de scraping.

Puedes guardar, reutilizar, y modificar instrucciones de análisis personalizadas a través de Web Scraper API. Una vez que crees un preset de parser, lo alojaremos en nuestro sistema, lo que te permitirá referenciarlo en tus trabajos de scraping mediante el parser_preset parámetro en el payload.

Esta función ofrece varias capacidades clave:

  • Guardar y administrar tus propios parsers en nuestro sistema

  • Reutilizar fácilmente presets en varios trabajos de scraping

  • Crear, recuperar, actualizar, eliminar y listar todos los presets

  • Acceder a estadísticas de rendimiento y uso de un preset

  • Adaptarse a los cambios de los sitios mediante presets autorreparables

Referencia de la API

Endpoint: https://data.oxylabs.io/v1/parsers/presets

La tabla enumera cada operación disponible y la ruta de su endpoint:

Acción
Método de solicitud
Ruta

Crear un preset

POST

/v1/parsers/presets

Recuperar un preset

GET

/v1/parsers/presets/{preset_name}

Actualizar un preset

PUT

/v1/parsers/presets/{preset_name}

Eliminar un preset

DELETE

/v1/parsers/presets/{preset_name}

Listar todos presets

GET

/v1/parsers/presets

Ver uso y rendimiento estadísticas

GET

/v1/parsers/presets/{preset_name}/stats

Rastrear cambios de autorreparación

GET

/v1/parsers/presets/{parser_name}/changelog

Habilitar autorreparación

Los presets de parser están equipados con la función de autorreparación, que ayuda a mantener los parsers y sus tasas de éxito a medida que cambian los sitios web. Cuando está habilitada, los presets de parser se reparan automáticamente y ajustan las instrucciones de análisis en segundo plano sin necesidad de entrada manual adicional.

Para habilitar autorreparación para tu preset de parser personalizado, incluye los siguientes parámetros obligatorios al crear o actualizar un preset:

Parámetro
Descripción

self_heal

Activa la funcionalidad de autorreparación cuando se establece en True.

prompt_schema

Un esquema JSON que describe el resultado requerido del parser. Puedes crear automáticamente el esquema cuando generas parsers con API.

urls

Una lista de hasta 5 URLs del mismo tipo de página. Recomendamos proporcionar 3-5 URLs para ayudar al parser a adaptarse a diferentes diseños y mejorar la precisión del análisis.

Ejemplo de payload

El ejemplo de payload que se muestra aquí habilita la autorreparación al actualizar un preset existente.

Endpoint: PUT https://data.oxylabs.io/v1/parsers/presets/{preset_name}

Ejemplos de uso

Crear un preset

Endpoint: POST https://data.oxylabs.io/v1/parsers/presets

Payload:

Salida

Usar un preset

Endpoint: POST https://realtime.oxylabs.io/v1/queries

Payload:

Salida

Recuperar un preset

Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}

Salida

Actualizar un preset

Endpoint: PUT https://data.oxylabs.io/v1/parsers/presets/{preset_name}

Define los campos del preset que quieres actualizar. En el siguiente ejemplo, solo se parsing_instructions se actualizará.

Payload:

Salida

Eliminar un preset

Endpoint: DELETE https://data.oxylabs.io/v1/parsers/presets/{preset_name}

Listar todos los presets

Endpoint: GET https://data.oxylabs.io/v1/parsers/presets

Salida

Ver estadísticas

Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}/stats

Salida

Puedes filtra los resultados por fecha y hora usando los parámetros de URL date_from y/o date_to . Usa el formato YYYY-MM-DDTHH, donde T indica la hora, y HH es la hora en formato de 24 horas.

Por ejemplo, para obtener estadísticas de 9 a. m. a 2 p. m. del 5 de agosto de 2025:

Rastrear cambios de autorreparación

Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}/changelog

Nuestro sistema registra automáticamente la actividad de autorreparación. Puedes acceder a este registro histórico para revisar todas las modificaciones realizadas por la función de autorreparación.

Última actualización

¿Te fue útil?