OxyCopilot
Automatiza el scraping con OxyCopilot. Aprende a generar payloads para Web Scraper API, parsers personalizados e instrucciones de navegador usando simples prompts en lenguaje natural.
OxyCopilot es una función gratuita Web Scraper API función que facilita la incorporación y ayuda a los usuarios a encontrar soluciones efectivas para casos de uso complejos, todo sin necesidad de conocimientos de programación. OxyCopilot incluye actualmente tres funciones separadas:
Constructor de scrapers
Analizador personalizado constructor
Constructor de instrucciones del navegador
OxyCopilot es accesible en el Web Playground de Scraper API en el panel de control de Oxylabs.
Constructor de scrapers
OxyCopilot te ayuda a configurar un scraper (y a formar la carga útil de la petición) para la Web Scraper API sin necesidad de entender la documentación o la lógica de los campos.
Cómo funciona
Paso 1: Proporciona una URL y un prompt
URL: Proporciona la URL que deseas extraer.
Prompt: Describe tus requisitos (p. ej., localización, renderizado JS, etc.).

Paso 2: Analizar
Tienes tres opciones para manejar el análisis:
Analizador personalizado: Selecciona "Agregar instrucciones de análisis" para crear tu propia lógica de análisis usando el Constructor de Parser personalizado.
Parser dedicado: Si la URL proviene de un sitio web para el que ofrecemos un parser dedicado y quieres usarlo, selecciona "Continuar con Parser dedicado".
Sin análisis: Elige continuar sin análisis si no se necesitan datos estructurados.
Si la URL pertenece a un sitio web para el que tenemos un parser dedicado, pero no necesitas datos estructurados, selecciona "Continuar con Parser dedicado" y desactiva el parámetro parse en la configuración del playground. Evita usar el botón de salir, ya que no guardará los parámetros prellenados.


Paso 3: Revisa la petición
Según tu prompt, OxyCopilot rellenará previamente los parámetros necesarios en el Web Scraper API Playground. Verás el código de petición específico y los parámetros para tu caso de uso, y podrás ajustar los parámetros si es necesario.
Paso 4: Envía la petición y copia
Si todo se ve bien, envía la petición para ver cómo se muestra la salida y comprobar si funciona como esperas. Luego, copia el código de la petición para usarlo en tus futuras tareas de scraping con la Web Scraper API.
Ejemplo
URL
Prompt
Parámetros generados por IA (JSON)
Códigos de petición generados por IA

Constructor de Parser personalizado
Aprovecha la Analizador personalizado función con OxyCopilot para construir un parser sin necesidad de escribir código ni analizar manualmente las estructuras del sitio web.
Cómo funciona
Paso 1: Proporciona URL(s) y prompt
URL(s): Puedes proporcionar hasta 3 URL para las cuales deseas generar instrucciones de análisis. OxyCopilot utiliza el HTML de las URL proporcionadas para determinar la mejor lógica para extraer los campos requeridos.
Prompt: El prompt es el componente clave para construir un esquema en lenguaje natural, que sirve como base para generar las instrucciones de análisis reales. El prompt debe describir claramente los campos que deben ser analizados.

Paso 2 [Opcional]: Ajusta el esquema de análisis
Este paso te permite afinar el esquema de análisis para que se ajuste mejor a tus necesidades o solucionar cualquier problema.
Resumen del esquema de análisis

Esta tabla visualiza la entrada usada por la IA para generar las instrucciones de análisis. El esquema define qué campos deben analizarse y consiste en varios tipos de objetos (explicados en la tabla a continuación).
Cada elemento del esquema debe tener:
Nombre: Esto se usará como la clave del objeto en las instrucciones de análisis y será visible en los datos analizados.
Descripción (opcional pero recomendado): Ayuda a mejorar la precisión del análisis.
Ajustes del esquema
Reordenar elementos: Arrastra y suelta los elementos usando los puntos en el lado izquierdo para cambiar su orden (solo se pueden mover elementos dentro del mismo nivel de anidación).
Editar elementos: Haz clic en el icono de editar para modificar cualquier campo.
Eliminar elementos: Puedes eliminar cualquier elemento en el nivel padre.
Agregar nuevos elementos: Añade nuevos elementos al nivel padre.
Una vez que actualices el esquema, haz clic en el "Actualizar salida" botón para regenerar las instrucciones y previsualizar los datos analizados.
Explicaciones de tipos de objeto
String
Una sola salida de texto
“title”: “Ejemplo de título de producto”
Número
Un solo número
“price”: 9.99
Array de cadenas
Una lista de salidas de texto
“products”: [“producto 1”, “producto 2”, “producto 3”]
Array de números
Una lista de números
“pages”: [1, 2, 3]
Array de objetos
Una lista de objetos/elementos, cada uno con sus propios objetos dentro (_items bloque en las instrucciones de análisis)
Trabajando con array de objetos
Selecciona "Array de objetos": Esta opción añade un objeto hijo y un botón.
Rellena nombres de objetos: Para guardar el elemento en el esquema, debes completar los nombres tanto del objeto padre como del hijo. Una vez hecho, la marca de verificación se volverá verde.
Requisito de objeto hijo: Un "Array de objetos" debe tener al menos un hijo.
Probar las instrucciones
Por defecto, los datos analizados se basan en la primera URL proporcionada en Paso 1. También puedes proporcionar una URL diferente para probar las instrucciones de análisis:

Las instrucciones se generan en función de las URL iniciales y no tienen en cuenta las URL de prueba. Editar el prompt o las URL restablecerá el esquema, requiriendo una regeneración completa.
Paso 3: Copiar/Guardar instrucciones e integrar en trabajos de scraping
Una vez que las instrucciones sean satisfactorias:
Usa el "Copiar" botón para copiar las instrucciones y pegarlas en el código de tu scraper.
Alternativamente, guarda las instrucciones en tu sesión del Web Scraper API Playground, ajusta otros parámetros de la petición, prueba y luego copia el código de la petición completo en tu lenguaje de programación preferido.

Ejemplo
URL
Prompt
Esquema de análisis
String
product_title
Título del producto
Número
precio
Precio del producto
Array de cadenas
related_products
Títulos de productos relacionados debajo de la información principal del producto
Instrucciones de análisis
Datos analizados
Generando instrucciones de análisis vía API
Si quieres generar muchos conjuntos diferentes de instrucciones de análisis para cubrir la variedad de sitios web con los que trabajas, puedes crear instrucciones de análisis vía una API: consulta API generadora de instrucciones de análisis para ver cómo se hace.
Constructor de instrucciones del navegador
Puedes usar OxyCopilot para crear scripts complejos de interacción con páginas sin analizar la estructura del sitio ni escribir manualmente la configuración para tus Instrucciones del navegador.
Cómo funciona
Paso 1: Proporciona una URL y un prompt
URL: Proporciona una sola URL para generar instrucciones del navegador. OxyCopilot utiliza el HTML de la URL proporcionada para determinar cómo secuenciar las interacciones con la página web que necesitas.
Prompt: El prompt es crucial para construir las instrucciones del navegador. Indica claramente qué acciones deseas que se realicen en la página web una vez abierta (p. ej., "Desplazarse hasta el final, esperar a que cargue el botón 'página siguiente', hacer clic en el botón 'página siguiente'").

Paso 2 [Opcional]: Ajusta las instrucciones del navegador
Este paso te permite afinar la secuencia de instrucciones del navegador para que se ajuste mejor a tus necesidades o solucionar cualquier problema.
Resumen de las instrucciones del navegador

Una vez que OxyCopilot termine de procesar tu entrada, mostrará la secuencia de instrucciones del navegador que ha creado.
Puedes ajustar la secuencia editando, añadiendo o eliminando pasos.
Paso 3: Copiar/Guardar instrucciones e integrar en trabajos de scraping
Una vez que las instrucciones sean satisfactorias, puedes guardar las instrucciones en tu sesión del Web Scraper API Playground, ajustar otros parámetros de la petición, probar y luego copiar el código de la petición completo en tu lenguaje de programación preferido.

Agradecemos tus comentarios y sugerencias para mejorar. No dudes en contactarnos en [email protected] o conectar con nuestro soporte en vivo 24/7.
Última actualización
¿Te fue útil?

