For the complete documentation index, see llms.txt. This page is also available as Markdown.

SDK de JavaScript

Aprende a usar el SDK de JavaScript de AI Studio.

Ofrecemos un SDK de JavaScript para interactuar sin problemas con la API de Oxylabs AI Studio servicios, incluidos AI-Scraper, AI-Crawler, AI-Browser-Agent y otras herramientas de extracción de datos.

Instalación

Instala el SDK:

npm install oxylabs-ai-studio

Agrega OXYLABS_AI_STUDIO_API_URL y OXYLABS_AI_STUDIO_API_KEY valores al .env archivo, o como variables de entorno:

export OXYLABS_AI_STUDIO_API_KEY=your_api_key_here

Uso

AI-Scraper

import { 
  OxylabsAIStudioSDK
} from 'oxylabs-ai-studio';

const sdk = new OxylabsAIStudioSDK({
  apiKey: 'your_api_key_here',
  timeout: 120000,
  retryAttempts: 3,
});

async function testGenerateSchema() {
  try {
    console.log('Testing schema generation...');
    const schema = await sdk.aiScraper.generateSchema({
      user_prompt: 'Extrae el título de la página'
    });
    console.log('Schema:', schema);
  } catch (error) {
    console.error('Schema generation error:', error.message);
  }
}

testGenerateSchema();

Uso básico

Parámetros de entrada

  • url (string): La URL de destino a procesar.

  • user_prompt (string): Instrucciones sobre qué datos extraer. Esto se usa para generar automáticamente el openapi_schema al usar el método scrapeWithAutoSchema .

  • output_format (string): El formato deseado para la salida. Puede ser markdown o json. El valor predeterminado es markdown.

  • render_html (boolean): Especifica si se debe renderizar JavaScript en la página antes de la extracción. El valor predeterminado es false.

  • openapi_schema (Record<string, any>): Un objeto de JSON Schema que define la estructura de los datos de salida. Esto es obligatorio cuando output_format está establecido en json.

  • geo_location (string): Especifica la ubicación geográfica (formato ISO2) desde la que se debe simular la solicitud.

AI-Crawler

Uso básico

Parámetros de entrada

  • url (string): La URL inicial para el rastreo.

  • crawl_prompt (string): Instrucciones que definen los tipos de páginas que se deben encontrar y rastrear.

  • parse_prompt (string): Instrucciones sobre qué datos extraer de las páginas rastreadas. Esto se usa para generar automáticamente el openapi_schema al usar el método crawlWithAutoSchema .

  • output_format (string): El formato deseado para la salida. Puede ser markdown o json. El valor predeterminado es markdown.

  • max_pages (integer): El número máximo de páginas o fuentes a devolver. El valor predeterminado es 25.

  • render_html (boolean): Especifica si se debe renderizar JavaScript en las páginas antes de la extracción. El valor predeterminado es false.

  • openapi_schema (Record<string, any>): Un objeto de JSON Schema que define la estructura de los datos de salida. Esto es obligatorio cuando output_format está establecido en json.

  • geo_location (string): Especifica la ubicación geográfica (formato ISO2) desde la que se debe simular la solicitud.

Browser-Agent

Uso básico

Parámetros de entrada

  • url (string): La URL de destino inicial para que el agente de navegador comience.

  • browse_prompt (string): Instrucciones que definen las acciones que debe realizar el agente de navegador.

  • parse_prompt (string): Instrucciones sobre qué datos extraer después de realizar las acciones del navegador. Esto se usa para generar automáticamente el openapi_schema al usar el método browseWithAutoSchema .

  • output_format (string): El formato deseado para la salida. Puede ser markdown, html, json, o screenshot. El valor predeterminado es markdown.

  • render_html (boolean): Especifica si se debe renderizar JavaScript en la página. Aunque es un agente de navegador, este indicador podría influir en ciertos comportamientos. El valor predeterminado es false.

  • openapi_schema (Record<string, any>): Un objeto de JSON Schema que define la estructura de los datos de salida. Esto es obligatorio cuando output_format está establecido en json.

  • geo_location (string): Especifica la ubicación geográfica (formato ISO2) desde la que se debe simular la solicitud.

Uso básico

Parámetros de entrada

  • query (string): La consulta de búsqueda.

  • limit (integer): El número máximo de resultados de búsqueda a devolver. Máximo: 50.

  • render_javascript (boolean): Si se debe renderizar JavaScript en la página. El valor predeterminado es false.

  • return_content (boolean): Si se debe devolver el contenido en markdown de cada resultado de búsqueda. El valor predeterminado es true.

  • geo_location (string): Especifica la ubicación geográfica (formato ISO2) desde la que se debe simular la solicitud.

AI-Map

Uso básico

Parámetros de entrada

  • url (string): La URL de destino para mapear y extraer datos.

  • user_prompt (string): Instrucciones sobre qué datos extraer de las páginas mapeadas.

  • return_sources_limit (integer): El número máximo de fuentes/páginas a devolver del proceso de mapeo.

  • geo_location (string): La ubicación geográfica que se usará para la solicitud de mapeo (por ejemplo, 'US', 'UK').

  • render_javascript (boolean): Especifica si se debe renderizar JavaScript en las páginas antes de mapear. El valor predeterminado es false.

Ejemplos de uso

Puedes encontrar más ejemplos de cada aplicación aquí:

Última actualización

¿Te fue útil?