Generación de instrucciones de parsing vía API
Mira cómo puedes generar parsers automáticamente enviando solicitudes a la API.
Puede generar conjuntos de instrucciones de análisis mediante la API proporcionando URLs y describiendo qué puntos de datos desea extraer. Al recibir las instrucciones generadas, puede guardarlas como un parser preset o simplemente enviar las instrucciones con su solicitud de scraping.
También puede generar instrucciones de análisis vía OxyCopilot en nuestro Web Scraper API Playground.
Generar instrucciones desde prompt
Puede generar instrucciones de análisis ingresando una descripción en texto libre de los puntos de datos que desea extraer y proporcionando algunas URLs que pertenezcan al mismo tipo de página. La API responderá con un conjunto de instrucciones de análisis.
Endpoint:
https://data.oxylabs.io/v1/parsers/generate-instructions/promptMétodo:
POSTsección de Autenticación:
BásicoEncabezados de la solicitud:
Content-Type: application/json
Carga de ejemplo
{
"prompt_text": "Analizar el título del producto, el precio principal, el nombre del desarrollador y el nombre de la plataforma.",
"urls": [
"https://sandbox.oxylabs.io/products/1",
"https://sandbox.oxylabs.io/products/2",
"https://sandbox.oxylabs.io/products/4"
],
"render": false
}prompt_text
Descripción en texto libre de los puntos de datos a analizar.
urls
Lista de URLs que ejemplifican el tipo de página para la que desea obtener instrucciones de análisis. Recomendamos proporcionar 3-5 URLs para ayudar al parser a adaptarse a diferentes diseños y mejorar la precisión del análisis.
user_agent_type
Indica si se debe usar o no el renderizado de JS para obtener el contenido requerido.
- parámetro obligatorio
Respuesta de ejemplo
Generar instrucciones desde esquema JSON
Hay casos en los que desea obtener datos parseados en un esquema JSON específico. Puede usar este endpoint para obtener instrucciones de análisis que se adhieran estrictamente al esquema que proporcione.
Endpoint:
https://data.oxylabs.io/v1/parsers/generate-instructions/schemaMétodo:
POSTsección de Autenticación:
BásicoEncabezados de la solicitud:
Content-Type: application/json
Carga de ejemplo
prompt_schema
Esquema JSON que describe la salida requerida del parser.
urls
Lista de URLs que ejemplifican el tipo de página para la que desea obtener instrucciones de análisis.
user_agent_type
Indica si se debe usar o no el renderizado de JS para obtener el contenido requerido.
- parámetro obligatorio
Respuesta de ejemplo
Última actualización
¿Te fue útil?

