Documentation has been updated: see help center and changelog in one place.

JavaScript SDK

Aprende a usar el SDK de JavaScript de AI Studio.

YouTube

Ofrecemos un SDK de JavaScript para interactuar sin problemas con Oxylabs AI Studio API servicios, incluyendo AI-Scraper, AI-Crawler, AI-Browser-Agent y otras herramientas de extracción de datos.

Instalación

Instala el SDK:

Añade cualquiera de OXYLABS_AI_STUDIO_API_URL y OXYLABS_AI_STUDIO_API_KEY valores al .env archivo, o como tus variables de entorno:

Usage

AI-Scraper

Uso básico

Parámetros de entrada

  • url (string): La URL objetivo a procesar.

  • user_prompt (string): Instrucciones sobre qué datos extraer. Esto se usa para generar automáticamente el openapi_schema al usar el scrapeWithAutoSchema método.

  • output_format (string): El formato deseado para la salida. Puede ser markdown o json. Por defecto es markdown.

  • render_html (booleano): Especifica si renderizar JavaScript en la página antes de la extracción. Por defecto es false.

  • openapi_schema (Record<string, any>): Un objeto JSON Schema que define la estructura de los datos de salida. Esto es obligatorio cuando output_format está configurado a json.

  • geo_location (string): Especifica la ubicación geográfica (formato ISO2) desde la cual se debe simular la solicitud.

AI-Crawler

Uso básico

Parámetros de entrada

  • url (string): La URL de inicio para el crawling.

  • crawl_prompt (string): Instrucciones que definen los tipos de páginas a encontrar y rastrear.

  • parse_prompt (string): Instrucciones sobre qué datos extraer de las páginas rastreadas. Esto se usa para generar automáticamente el openapi_schema al usar el crawlWithAutoSchema método.

  • output_format (string): El formato deseado para la salida. Puede ser markdown o json. Por defecto es markdown.

  • max_pages (integer): El número máximo de páginas o fuentes a devolver. Por defecto es 25.

  • render_html (booleano): Especifica si renderizar JavaScript en las páginas antes de la extracción. Por defecto es false.

  • openapi_schema (Record<string, any>): Un objeto JSON Schema que define la estructura de los datos de salida. Esto es obligatorio cuando output_format está configurado a json.

  • geo_location (string): Especifica la ubicación geográfica (formato ISO2) desde la cual se debe simular la solicitud.

Browser-Agent

Uso básico

Parámetros de entrada

  • url (string): La URL objetivo donde el agente del navegador debe comenzar.

  • browse_prompt (string): Instrucciones que definen las acciones que debe realizar el agente del navegador.

  • parse_prompt (string): Instrucciones sobre qué datos extraer después de realizar las acciones del navegador. Esto se usa para generar automáticamente el openapi_schema al usar el browseWithAutoSchema método.

  • output_format (string): El formato deseado para la salida. Puede ser markdown, html, json, o screenshot. Por defecto es markdown.

  • render_html (booleano): Especifica si renderizar JavaScript en la página. Aunque este es un agente de navegador, este indicador puede influir en ciertos comportamientos. Por defecto es false.

  • openapi_schema (Record<string, any>): Un objeto JSON Schema que define la estructura de los datos de salida. Esto es obligatorio cuando output_format está configurado a json.

  • geo_location (string): Especifica la ubicación geográfica (formato ISO2) desde la cual se debe simular la solicitud.

Uso básico

Parámetros de entrada

  • query (string): La consulta de búsqueda.

  • limit (integer): El número máximo de resultados de búsqueda a devolver. Máximo: 50.

  • render_javascript (booleano): Si renderizar JavaScript en la página. Por defecto es false.

  • return_content (booleano): Si devolver el contenido en markdown de cada resultado de búsqueda. Por defecto es true.

  • geo_location (string): Especifica la ubicación geográfica (formato ISO2) desde la cual se debe simular la solicitud.

AI-Map

Uso básico

Parámetros de entrada

  • url (string): La URL objetivo para mapear y extraer datos.

  • user_prompt (string): Instrucciones sobre qué datos extraer de las páginas mapeadas.

  • return_sources_limit (integer): El número máximo de fuentes/páginas a devolver del proceso de mapeo.

  • geo_location (string): La ubicación geográfica a usar para la solicitud de mapeo (p. ej., 'US', 'UK').

  • render_javascript (booleano): Especifica si renderizar JavaScript en las páginas antes del mapeo. Por defecto es false.

Ejemplos de uso

Puedes encontrar más ejemplos de cada aplicación aquí:

Última actualización

¿Te fue útil?