Parser Presets
Descubre cómo funcionan los presets de parser y cómo usarlos en tus trabajos de scraping.
Puedes save, reutilizar, y modificar instrucciones de parseo personalizadas a través de la Web Scraper API. Una vez que crees un preset de parser, lo alojaremos en nuestro sistema, permitiéndote referenciarlo en tus trabajos de scraping mediante el parser_preset parámetro en la carga útil.
Esta función ofrece varias capacidades clave:
Guarda y administra tus propios parsers en nuestro sistema
Reutiliza fácilmente presets en múltiples trabajos de scraping
Crea, recupera, actualiza, elimina y lista todos los presets
Accede a estadísticas de rendimiento y uso de un preset
Adáptate a sitios cambiantes usando presets con auto-reparación
Referencia de API
Endpoint: https://data.oxylabs.io/v1/parsers/presets
La tabla lista cada operación disponible y su ruta de endpoint:
Crear un preset
POST
/v1/parsers/presets
Recuperar un preset
GET
/v1/parsers/presets/{preset_name}
Actualizar un preset
PUT
/v1/parsers/presets/{preset_name}
Eliminar un preset
DELETE
/v1/parsers/presets/{preset_name}
Listar todos presets
GET
/v1/parsers/presets
Ver uso y rendimiento estadísticas
GET
/v1/parsers/presets/{preset_name}/stats
Rastrear auto-reparación cambios
GET
/v1/parsers/presets/{parser_name}/changelog
Habilitar auto-reparación
Los presets de parser están equipados con la función de auto-reparación, que ayuda a mantener los parsers y sus tasas de éxito a medida que los sitios web cambian. Cuando está habilitada, los presets de parser se reparan automáticamente y ajustan las instrucciones de parseo en segundo plano sin entrada manual adicional.
Para habilitar la auto-reparación para tu preset de parser personalizado, incluye los siguientes parámetros obligatorios al crear o actualizar un preset:
self_heal
Activa la funcionalidad de auto-reparación cuando se establece en True.
prompt_schema
Un esquema JSON que describe la salida requerida del parser. Puedes crear el esquema automáticamente al generar parsers con API.
urls
Una lista de hasta 5 URLs del mismo tipo de página. Recomendamos proporcionar 3-5 URLs para ayudar al parser a adaptarse a diferentes diseños y mejorar la precisión del parseo.
Ejemplos de uso
Crear un preset
Endpoint: POST https://data.oxylabs.io/v1/parsers/presets
Carga útil:
Usar un preset
Endpoint: POST https://realtime.oxylabs.io/v1/queries
Carga útil:
Recuperar un preset
Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}
Actualizar un preset
Endpoint: PUT https://data.oxylabs.io/v1/parsers/presets/{preset_name}
Define los campos del preset que deseas actualizar. En el siguiente ejemplo, solo el parsing_instructions se actualizará.
Carga útil:
Eliminar un preset
Endpoint: DELETE https://data.oxylabs.io/v1/parsers/presets/{preset_name}
Listar todos los presets
Endpoint: GET https://data.oxylabs.io/v1/parsers/presets
Ver estadísticas
Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}/stats
Puedes filtrar resultados por fecha y hora usando el date_from y/o date_to Parámetros URL. Usa el formato YYYY-MM-DDTHH, donde T indica la hora, y HH es la hora en formato de 24 horas.
Por ejemplo, para obtener estadísticas desde las 9 AM hasta las 2 PM el 5 de agosto de 2025:
Rastrear cambios de auto-reparación
Endpoint: GET https://data.oxylabs.io/v1/parsers/presets/{preset_name}/changelog
Nuestro sistema registra automáticamente la actividad de auto-reparación. Puedes acceder a este registro histórico para revisar todas las modificaciones realizadas por la función de auto-reparación.
Última actualización
¿Te fue útil?

