Push-Pull
Descubre el método de integración Push-Pull para Oxylabs Web Scraper API. Envía un trabajo y luego consulta el endpoint de resultados más tarde usando datos con formato JSON.
Trabajo único
Endpoint
POST https://data.oxylabs.io/v1/queriesEntrada
curl --user "user:pass1" \
'https://data.oxylabs.io/v1/queries' \
-H "Content-Type: application/json" \
-d '{"source": "ENTER_SOURCE_HERE", "url": "https://www.example.com", "geo_location": "United States", "callback_url": "https://your.callback.url", "storage_type": "s3", "storage_url": "s3://your.storage.bucket.url"}'import requests
from pprint import pprint
# Estructura del payload.
payload = {
"source": "ENTER_SOURCE_HERE", # Fuente que eliges, por ejemplo "universal"
"url": "https://www.example.com", # Verifica la fuente específica para saber si debes usar "url" o "query"
"geo_location": "United States", # Algunas fuentes aceptan código postal o coordenadas
#"render" : "html", # Descomenta si quieres renderizar JavaScript dentro de la página
#"render" : "png", # Descomenta si quieres tomar una captura de pantalla de una página web extraída
#"parse" : true, # Comprueba qué fuentes admiten datos analizados
#"callback_url": "https://your.callback.url", # requerido si usas un listener de callback
"callback_url": "https://your.callback.url",
"storage_type": "s3",
"storage_url": "s3://your.storage.bucket.url"
}
# Obtener respuesta.
response = requests.request(
'POST',
'https://data.oxylabs.io/v1/queries',
auth=('YOUR_USERNAME', 'YOUR_PASSWORD'), # Tus credenciales van aquí
json=payload,
)
# Imprimir la respuesta con formato en stdout.
pprint(response.json())Salida
Diccionario de datos
Clave
Descripción
Tipo
Callback
Entrada
Salida
Comprobar estado del trabajo
Endpoint
Entrada
Salida
Valores de estado
Parámetro
Descripción
Recuperar contenido del trabajo
Endpoints
Entrada
Salida
Parámetro render
Parámetro parse
Parámetro XHR
Salida predeterminada
Salida disponible
Consulta por lotes
Endpoint
Entrada
Salida
Obtener lista de direcciones IP del notificador
Endpoint
Entrada
Salida
Scheduler
SchedulerÚltima actualización
¿Te fue útil?

