For the complete documentation index, see llms.txt. This page is also available as Markdown.

Cualquier dominio

Encuentra guías dedicadas y universales de Oxylabs Web Scraper API para cualquier sitio web público.

Descubre nuestras guías dedicadas de Web Scraper API para sitios web de comercio electrónico, motores de búsqueda, LLMs y IA, datos de video, bienes raíces plataformas, o extrae cualquier sitio web público con nuestra universal fuente usando la guía a continuación. Acepta URLs junto con parámetros adicionales.

Ejemplos de solicitud

En este ejemplo, la API recuperará una página de producto de comercio electrónico.

curl 'https://realtime.oxylabs.io/v1/queries' \
--user 'USERNAME:PASSWORD' \
-H 'Content-Type: application/json' \
-d '{
        "source": "universal",
        "url": "https://sandbox.oxylabs.io/products/1"
    }'
Ejemplo de salida
{
    "results": [
        {
            "content": "<!DOCTYPE html><html lang=\"en\">
            CONTENIDO
            </html>",
            "created_at": "2024-07-01 11:35:14",
            "updated_at": "2024-07-01 11:35:15",
            "page": 1,
            "url": "https://sandbox.oxylabs.io/products/1",
            "job_id": "7213505428280329217",
            "status_code": 200
        }
    ]
}

Usamos el método de integración síncrona Realtime en nuestros ejemplos. Si deseas usar Proxy Endpoint o la integración asíncrona Push-Pull consulta la sección de métodos de integración .

Valores de los parámetros de solicitud

Genérico

Parámetro
Descripción
Valor predeterminado

source

Establece el scraper.

universal

url

URL directa (enlace) a cualquier página.

-

callback_url

URL de tu endpoint de callback. Más información.

-

- parámetro obligatorio

Adicional

Estos son los parámetros de nuestro funcionalidades.

Parámetro
Descripción
Valor predeterminado

geo_location

Establece la ubicación geográfica del proxy para recuperar datos. Encuentra ubicaciones compatibles aquí.

-

render

Habilita el renderizado de JavaScript cuando se establece en html. Más información. NOTA: Si observas tasas de éxito bajas o recuperas contenido vacío, intenta añadir este parámetro.

-

browser_instructions

Define tus propias instrucciones del navegador que se ejecutan al renderizar JavaScript. Más información.

-

parse

Devuelve datos analizados cuando se establece en true, siempre que exista un analizador dedicado para el tipo de página de la URL enviada.

false

parsing_instructions

Define tu propia lógica de análisis y transformación de datos que se ejecutará sobre un resultado de scraping HTML. Leer más: Ejemplos de instrucciones de análisis.

-

context: headers

Envía tus propios encabezados. Más información aquí.

-

context: cookies

Envía tus propias cookies. Más información aquí.

-

context: session_id

Si quieres usar el mismo proxy con varias solicitudes, puedes hacerlo usando este parámetro. Solo establece tu sesión con cualquier cadena que quieras, y asignaremos un proxy a este ID, y lo mantendremos hasta 10 minutos. Después de eso, si haces otra solicitud con el mismo ID de sesión, se asignará un nuevo proxy a ese ID de sesión en particular.

-

context: http_method

Establécelo en post si deseas hacer una solicitud POST a tu URL de destino a través de E-Commerce Scraper API. Más información aquí.

get

user_agent_type

Tipo de dispositivo y navegador. La lista completa se puede encontrar aquí.

desktop

context: contenido

codificado en Base64 POST cuerpo de la solicitud. Solo es útil si http_method está establecido en post.

-

content_encoding

Añade este parámetro si estás descargando imágenes. Más información aquí.

base64

context: follow_redirects

Establecer en true para habilitar que el scraper siga redirecciones. De forma predeterminada, las redirecciones se siguen hasta un límite de 10 enlaces, tratando toda la cadena como un solo trabajo de scraping.

true

context: successful_status_codes

Define un código de respuesta HTTP personalizado (o varios), con el que consideraremos que el scraping fue exitoso y te devolveremos el contenido. Puede ser útil si quieres que devolvamos la página de error 503 o en otros casos no estándar.

-

Todos los parámetros

En este ejemplo, se incluyen todos los parámetros disponibles (aunque no siempre sean necesarios o compatibles dentro de la misma solicitud), para darte una idea de cómo formatear tus solicitudes.

Última actualización

¿Te fue útil?