Realtime
Integración Realtime para la Web Scraper API de Oxylabs. Mantenga la conexión HTTPS abierta desde el envío del trabajo hasta que se devuelvan resultados o un error, usando payloads en formato JSON.
Realtime es un método de integración síncrono. Se requiere mantener la conexión abierta hasta que el trabajo termine correctamente o devuelva un error.
Envío de trabajo
Endpoint
El endpoint Realtime API para el envío de trabajos es:
POST https://realtime.oxylabs.io/v1/queriesEntrada
Proporciona los parámetros del trabajo en una carga JSON como se muestra en los ejemplos a continuación. Los ejemplos en Python y PHP incluyen comentarios para mayor claridad.
curl --user "USERNAME:PASSWORD" \
'https://realtime.oxylabs.io/v1/queries' \
-H "Content-Type: application/json" \
-d '{"source": "universal", "url": "https://example.com", "geo_location": "United States"}'import requests
from pprint import pprint
# Estructurar payload.
payload = {
"source": "universal", # Fuente que eliges p. ej. "universal"
"url": "https://example.com", # Consulta la documentación de la fuente específica que estés usando para ver si debes usar "url" o "query"
"geo_location": "United States", # Algunas fuentes aceptan códigos postales y/o coordenadas
#"render" : "html", # Descomenta si deseas renderizar JavaScript en la página
#"render" : "png", # Descomenta si quieres tomar una captura de pantalla de una página web raspada
#"parse" : true, # Comprueba qué fuentes soportan datos parseados
}
# Obtener respuesta.
response = requests.request(
'POST',
'https://realtime.oxylabs.io/v1/queries',
auth=('YOUR_USERNAME', 'YOUR_PASSWORD'), #Tus credenciales van aquí
json=payload,
)
json=payload
# respuesta JSON con resultados.
pprint(response.json())Salida
Realtime API admite estos tipos de resultado en la salida:
HTML: El contenido HTML sin procesar extraído de la página web objetivo;
JSON: Datos estructurados analizados desde el contenido HTML, formateados en JSON;
PNG: Captura de pantalla en PNG codificada en Base64 de la página renderizada.
XHR: Solicitudes XHR realizadas mientras se carga la página.
Markdown: Markdown de una página web.
Esta tabla explica los tipos de resultado predeterminados y otros disponibles según los parámetros incluidos en la carga útil de la solicitud API.
x
x
html
html
html
x
html
html
png
x
png
html, png
x
true
json
html, json
html
true
json
html, json
png
true
png
html, json, png
Ejemplo de salida:
Última actualización
¿Te fue útil?

