Documentation has been updated: see help center and changelog in one place.

Custom Parser

Consulta los pasos para un inicio rápido con el Custom Parser de Oxylabs.

Custom Parser es una función gratuita de Web Scraper API que te permite crear lógica de análisis y procesamiento de datos que se ejecuta sobre un resultado HTML bruto. Puedes generar analizadores automáticamente usando IA o escribirlos manualmente para escenarios avanzados.

Para instrucciones detalladas y ejemplos, consulta estas páginas:

Comenzando Generación de analizadores vía API Ajustes predefinidos de analizadores

Escribir instrucciones manualmente Lista de funciones de análisis


Inicio rápido

1. Genera un analizador

Recomendamos empezar con nuestra herramienta impulsada por IA OxyCopilot que te permite generar scrapers y analizadores sin escribir código.

Sigue los pasos mostrados en el video para generar un analizador:

Aquí están los mismos pasos mostrados en el video:

  1. Introduce la(s) URL(s) que quieres extraer y analizar

  2. Especifica cualquier parámetro como la renderización de JavaScript

  3. Escribe un prompt que describa lo que quieres analizar

  4. Ejecuta OxyCopilot

Una vez estés satisfecho con el analizador generado, carga las instrucciones.

2. Guarda el analizador como un ajuste predefinido

Puedes guardar fácilmente los analizadores generados mediante OxyCopilot para usarlos más tarde. Ve los pasos a continuación:

  1. Asigna el ajuste predefinido a un usuario API específico

  2. Haz clic Guardar

  3. Introduce el nombre del ajuste y la descripción (opcional)

Después de guardar el ajuste predefinido, puedes usarlo en solicitudes API.

3. Usa el analizador con solicitudes API

Para usar tu ajuste predefinido con Web Scraper API, envía una carga útil con el parser_preset parámetro establecido al nombre de tu ajuste. En los ejemplos de código abajo, reutilizamos el example_parser ajuste predefinido creado en pasos anteriores.

Ejemplo de salida

Obtener el contenido HTML de un trabajo analizado

También puedes recuperar el resultado HTML bruto añadiendo ?type=raw al final de la URL de recuperación del resultado. Lee más aquí.

Última actualización

¿Te fue útil?