Push-Pull
Descubra o método de integração Push-Pull da Oxylabs Web Scraper API. Envie uma tarefa e depois consulte o endpoint de resultados mais tarde usando dados em formato JSON.
Job único
Endpoint
POST https://data.oxylabs.io/v1/queriesEntrada
curl --user "user:pass1" \
'https://data.oxylabs.io/v1/queries' \
-H "Content-Type: application/json" \
-d '{"source": "ENTER_SOURCE_HERE", "url": "https://www.example.com", "geo_location": "United States", "callback_url": "https://your.callback.url", "storage_type": "s3", "storage_url": "s3://your.storage.bucket.url"}'import requests
from pprint import pprint
# Estruture o payload.
payload = {
"source": "ENTER_SOURCE_HERE", # Fonte que você escolher, por exemplo, "universal"
"url": "https://www.example.com", # Verifique a fonte específica para saber se deve usar "url" ou "query"
"geo_location": "United States", # Algumas fontes aceitam CEP ou coordenadas
#"render" : "html", # Descomente se quiser renderizar JavaScript dentro da página
#"render" : "png", # Descomente se quiser tirar uma captura de tela de uma página web raspada
#"parse" : true, # Verifique quais fontes suportam dados analisados
#"callback_url": "https://your.callback.url", # necessário se estiver usando listener de callback
"callback_url": "https://your.callback.url",
"storage_type": "s3",
"storage_url": "s3://your.storage.bucket.url"
}
# Obtenha a resposta.
response = requests.request(
'POST',
'https://data.oxylabs.io/v1/queries',
auth=('YOUR_USERNAME', 'YOUR_PASSWORD'), # Suas credenciais vão aqui
json=payload,
)
# Imprima a resposta formatada no stdout.
pprint(response.json())Saída
Dicionário de dados
Chave
Descrição
Tipo
Callback
Entrada
Saída
Verificar status do job
Endpoint
Entrada
Saída
Valores de status
Parâmetro
Descrição
Recuperar conteúdo do job
Endpoints
Entrada
Saída
Parâmetro de render
Parâmetro de parse
Parâmetro XHR
Saída padrão
Saída disponível
Consulta em lote
Endpoint
Entrada
Saída
Obter lista de IPs do Notifier
Endpoint
Entrada
Saída
Scheduler
SchedulerAtualizado
Isto foi útil?

