Push-Pull
Descubre el método de integración Push-Pull para Oxylabs Web Scraper API. Envía un trabajo y luego consulta el endpoint de resultados más tarde usando datos en formato JSON.
Trabajo único
Endpoint
POST https://data.oxylabs.io/v1/queriesEntrada
curl --user "user:pass1" \\
'https://data.oxylabs.io/v1/queries' \\
-H "Content-Type: application/json" \
-d '{"source": "ENTER_SOURCE_HERE", "url": "https://www.example.com", "geo_location": "United States", "callback_url": "https://your.callback.url", "storage_type": "s3", "storage_url": "s3://your.storage.bucket.url"}'import requests
from pprint import pprint
# Structure payload.
payload = {
"source": "ENTER_SOURCE_HERE", # Source you choose e.g. "universal"
"url": "https://www.example.com", # Check speficic source if you should use "url" or "query"
"geo_location": "United States", # Some sources accept zip-code or cooprdinates
#"render" : "html", # Uncomment you want to render JavaScript within the page
#"render" : "png", # Uncomment if you want to take a screenshot of a scraped web page
#"parse" : true, # Check what sources support parsed data
#"callback_url": "https://your.callback.url", #required if using callback listener
"callback_url": "https://your.callback.url",
"storage_type": "s3",
"storage_url": "s3://your.storage.bucket.url"
}
# Get response.
response = requests.request(
'POST',
'https://data.oxylabs.io/v1/queries',
auth=('YOUR_USERNAME', 'YOUR_PASSWORD'), #Your credentials go here
json=payload,
)
# Print prettified response to stdout.
pprint(response.json())Salida
Diccionario de datos
Clave
Descripción
Tipo
Callback
Entrada
Salida
Comprobar el estado del trabajo
Endpoint
Entrada
Salida
Valores de estado
Parámetro
Descripción
Recuperar contenido del trabajo
Endpoints
Entrada
Salida
Parámetro de renderizado
Parámetro de parseo
Parámetro XHR
Salida predeterminada
Salida disponible
Consulta por lotes
Endpoint
Entrada
Salida
Obtener lista de direcciones IP del Notifier
Endpoint
Entrada
Salida
Scheduler
SchedulerÚltima actualización
¿Te fue útil?

