documentación de Parser Presets
Descubre cómo funcionan los presets de parser y cómo usarlos en tus trabajos de scraping.
Puedes guardar, reutilizar, y modificar instrucciones de análisis personalizadas a través de la Web Scraper API. Una vez que crees un preset de parser, lo alojaremos en nuestro sistema, permitiéndote referenciarlo en tus trabajos de scraping mediante el parser_preset parámetro en la carga útil.
Esta función ofrece varias capacidades clave:
Guarda y administra tus propios parsers en nuestro sistema
Reutiliza presets fácilmente en múltiples trabajos de scraping
Crea, recupera, actualiza, elimina y lista todos los presets
Accede a estadísticas de rendimiento y uso de un preset
Adáptate a sitios cambiantes usando presets de autocuración
Referencia de la API
Endpoint: https://data.oxylabs.io/v1/parsers/presets
La tabla lista cada operación disponible y su ruta de endpoint:
Crear un preset
POST
/v1/parsers/presets
Recuperar un preset
GET
/v1/parsers/presets/{preset_name}
Actualizar un preset
PUT
/v1/parsers/presets/{preset_name}
Eliminar un preset
DELETE
/v1/parsers/presets/{preset_name}
Listar todos presets
GET
/v1/parsers/presets
Ver uso y rendimiento estadísticas
GET
/v1/parsers/presets/{preset_name}/stats
Rastrear autocuración cambios
GET
/v1/parsers/presets/{parser_name}/changelog
Habilitar autocuración
Los parser presets están equipados con la función de autocuración, que ayuda a mantener los parsers y sus tasas de éxito a medida que los sitios web cambian. Cuando está habilitada, los presets de parser se reparan automáticamente y ajustan las instrucciones de análisis en segundo plano sin intervención manual adicional.
Para habilitar la autocuración para tu preset de parser personalizado, incluye los siguientes parámetros obligatorios al crear o actualizar un preset:
self_heal
Activa la funcionalidad de autocuración cuando se establece en True.
prompt_schema
Un esquema JSON que describe la salida requerida del parser. Puedes crear automáticamente el esquema al generar parsers con la API.
urls
Una lista de hasta 5 URLs del mismo tipo de página. Recomendamos proporcionar 3-5 URLs para ayudar al parser a adaptarse a diferentes diseños y mejorar la precisión del análisis.
Ejemplo de carga útil
El ejemplo de payload mostrado aquí habilita la autocuración actualizando un preset existente.
Endpoint: PUT https://data.oxylabs.io/v1/parsers/presets/{preset_name}
Ejemplos de uso
Crear un preset
Endpoint: POST https://data.oxylabs.io/v1/parsers/presets
Carga útil:
Usar un preset
Endpoint: POST https://realtime.oxylabs.io/v1/queries
Carga útil:
Recuperar un preset
Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}
Actualizar un preset
Endpoint: PUT https://data.oxylabs.io/v1/parsers/presets/{preset_name}
Define los campos del preset que deseas actualizar. En el siguiente ejemplo, solo parsing_instructions se actualizará.
Carga útil:
Eliminar un preset
Endpoint: DELETE https://data.oxylabs.io/v1/parsers/presets/{preset_name}
Listar todos los presets
Endpoint: GET https://data.oxylabs.io/v1/parsers/presets
Ver estadísticas
Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}/stats
Puedes filtrar resultados por fecha y hora usando los date_from y/o date_to parámetros URL. Usa el formato YYYY-MM-DDTHH, donde T indica la hora, y HH es la hora en formato de 24 horas.
Por ejemplo, para obtener estadísticas de 9 AM a 2 PM el 5 de agosto de 2025:
Rastrear cambios de autocuración
Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}/changelog
Nuestro sistema registra automáticamente la actividad de autocuración. Puedes acceder a este registro histórico para revisar todas las modificaciones realizadas por la función de autocuración.
Última actualización
¿Te fue útil?

