Documentation has been updated: see help center and changelog in one place.

Generación de instrucciones de parsing vía API

Mira cómo puedes generar parsers automáticamente enviando solicitudes a la API.

Puede generar conjuntos de instrucciones de análisis mediante la API proporcionando URLs y describiendo qué puntos de datos desea extraer. Al recibir las instrucciones generadas, puede guardarlas como un parser preset o simplemente enviar las instrucciones con su solicitud de scraping.

También puede generar instrucciones de análisis vía OxyCopilot en nuestro Web Scraper API Playground.

Generar instrucciones desde prompt

Puede generar instrucciones de análisis ingresando una descripción en texto libre de los puntos de datos que desea extraer y proporcionando algunas URLs que pertenezcan al mismo tipo de página. La API responderá con un conjunto de instrucciones de análisis.

  • Endpoint: https://data.oxylabs.io/v1/parsers/generate-instructions/prompt

  • Método: POST

  • sección de Autenticación: Básico

  • Encabezados de la solicitud: Content-Type: application/json

Carga de ejemplo

{ 
  "prompt_text": "Analizar el título del producto, el precio principal, el nombre del desarrollador y el nombre de la plataforma.",
  "urls": [
    "https://sandbox.oxylabs.io/products/1",
    "https://sandbox.oxylabs.io/products/2",
    "https://sandbox.oxylabs.io/products/4"
  ],
  "render": false
}
Parámetro
Descripción

prompt_text

Descripción en texto libre de los puntos de datos a analizar.

urls

Lista de URLs que ejemplifican el tipo de página para la que desea obtener instrucciones de análisis. Recomendamos proporcionar 3-5 URLs para ayudar al parser a adaptarse a diferentes diseños y mejorar la precisión del análisis.

user_agent_type

Indica si se debe usar o no el renderizado de JS para obtener el contenido requerido.

- parámetro obligatorio

Respuesta de ejemplo

Generar instrucciones desde esquema JSON

Hay casos en los que desea obtener datos parseados en un esquema JSON específico. Puede usar este endpoint para obtener instrucciones de análisis que se adhieran estrictamente al esquema que proporcione.

  • Endpoint: https://data.oxylabs.io/v1/parsers/generate-instructions/schema

  • Método: POST

  • sección de Autenticación: Básico

  • Encabezados de la solicitud: Content-Type: application/json

Carga de ejemplo

Parámetro
Descripción

prompt_schema

Esquema JSON que describe la salida requerida del parser.

urls

Lista de URLs que ejemplifican el tipo de página para la que desea obtener instrucciones de análisis.

user_agent_type

Indica si se debe usar o no el renderizado de JS para obtener el contenido requerido.

- parámetro obligatorio

Respuesta de ejemplo

Última actualización

¿Te fue útil?